FASTA filformatet används för att lagra sequence data från nukleinsyror eller peptider . Flera sekvenser kan lagras i en enda fil , en så kallad multi - FASTA fil . Sekvenser data formateras som en kort rubrikrad identifierar sekvensen och den datamängd efter en ny linje . Genom att placera sekvensen headers i en multi- FASTA- fil med Perl kommandon , är det möjligt att utvinna individuella sekvenser från en multi- FASTA- fil. Instruktioner
1
Öppna en textredigerare med en tom textfil för att börja ett nytt Perl -program .
2
påbörja programmet genom att ange platsen för Perl på ditt system . Detta är normalt " /usr /bin /perl " eller " /usr /local /bin /perl . "
# ! /Usr /bin /perl
3
Importera den " strikta " och " fil :: basename " bibliotek . Den " File :: basename " Biblioteket stöder tolkning av sökvägar och tillägg . Den " strikta " bibliotek begränsar osäkra konstruktioner , kastar ett fel under kompileringen snarare än vid körning .
Användning strictuse File :: basename
4
Läs argumentet variabeln från kommandoraden . Ditt program bör du välja att namnge den " fasta_extract.pl , " förväntar sig att ges plats för en FASTA fil och parametrar för att välja sekvenser för att extrahera . Den första parametern är ett FASTA filnamn och den andra kommer att vara en sträng för mönstermatchning . Argument variabel nås från " $ ARGV " array
min $ fasta_file = $ ARGV [ 0 ] ; . Min $ mönster = $ ARGV [ 1 ] ,
5
Open FASTA fil med " open ( ) " -funktion . Du kommer att ange att programmet avslutas , om det inte kan öppna filen med " die " kommandot
open ( INPUT , $ fasta_file )