FASTA är ett textbaserat format som används i bioinformatik för att representera sekvenser , speciellt de av nukleotider och peptider , med baspar representeras av en enda bokstav . En FASTA sekvensen består av en enda rad beskrivning , kännetecknas av ett " större än " symbol på den första raden , följt av en multi - line nukleotid eller peptid sekvens . Du kan extrahera flera sekvenser från en FASTA fil med speciella moduler , eller tillägg , till Perl programmeringsspråk , bekant som bioperl , som har utvecklats speciellt för att hantera FASTA format . Du kan också manuellt koda ett Perl-skript för att matcha mönster i en fil eller att använda andra tillgängliga verktyg för att extrahera FASTA sekvenser . Saker du behöver
FASTA fil
Perl Redaktör bioperl
ActiveState Perl
Biopieces
Visa fler instruktioner
1
Starta din Perl redaktör ansökan . Du kan använda en enkel textredigerare , till exempel Anteckningar . Du måste spara filen med ett " . Pl " förlängning för att indikera att det är ett Perl -program .
2
Utdrag en sekvens från en multipel - FASTA filen genom att utföra mönstermatchning i Perl , genom att skriva följande kod i editorn :
# /usr /bin /perlmy $ fasta_seq = skift, min $ sekvens = skift, min $ workfile = ` cat $ fasta_seq ` , min ( $ fasta_seq ) = ! $ workfile = ~ /( > $ sekvens [ ^ > ] + ) /s , print $ fasta_seq ,
3
Utdrag sekvenserna från FASTA filen med bioperl . Du kan extrahera flera sekvenser genom att skriva följande kod i editorn :
# /bin /perl - w
användning Bio :: SeqIO ,
$ sequenceobject = Bio ! :: SeqIO - > ny ( - file = > " fasta_file_path " , - format = > " FASTA " ) ;
Bio :: SeqIO modulen ger sömlös sekvens bearbetning . Du kan hämta en enda sekvens med följande uttalande :
$ retrievedsequence = $ sequenceobject - > next_seq ,
Du kan loopa genom objektet och hämta flera sekvenser , enligt följande :
while ( $ retrievedsequence = $ sequenceobject - > next_seq ) { print $ retrievedsequence - > seq , " \\ n " ;}
4
Utdrag sekvenserna från FASTA filen med " Biopieces " program , som är ramverk som innehåller en uppsättning av modulära verktyg för att manipulera bioinformatik uppgifter . Du kör ditt Biopieces kommando på kommandoraden
read_fasta -i fasta_file