FASTA is een tekst - gebaseerde formaat dat wordt gebruikt in de bioinformatica voor het weergeven van sequenties , vooral die van nucleotiden en peptiden , met basenparen vertegenwoordigd door een enkele letter . Een FASTA sequentie bestaat uit een lijn beschrijving , gekenmerkt door een " groter dan" symbool op de eerste regel , gevolgd door een multi - lijn nucleotide-of peptidesequentie . U kunt meerdere sequenties extraheren uit een FASTA bestand met behulp van speciale modules of add -ons , de programmeertaal Perl , bekend als bioperl , die speciaal zijn ontwikkeld om de FASTA formaat te verwerken . U kunt ook handmatig een Perl- script om patronen te passen in een bestand of gebruik maken van andere beschikbare instrumenten om FASTA sequenties extraheren coderen . Wat je nodig hebt FASTA bestand Perl editor bioperl ActiveState Perl Biopieces Toon Meer Aanwijzingen 1 Lanceer uw Perl editor toepassing . U kunt een eenvoudige tekst-editor , zoals Kladblok gebruiken . U moet het bestand op te slaan met een " pl . " Extensie aan te geven dat het een Perl-programma . Kopen van 2 Uittreksel van een sequentie van een multiple - FASTA bestand door het uitvoeren van pattern - matching in Perl , door in de editor het volgende te typen code : # /usr /bin /perlmy $ fasta_seq = shift; mijn $ sequence = shift; mijn $ Workfile = `cat $ fasta_seq ` ; mijn ( $ fasta_seq ) = ! $ Workfile = ~ /( > $ sequence [ ^ > ] + ) /s ; druk $ fasta_seq ; 3 Pak de sequenties van het FASTA bestand met bioperl . U kunt meerdere reeksen halen door in de editor het volgende te typen code : # /bin /perl - w gebruik Bio :: SeqIO ; $ sequenceobject = Bio ! :: SeqIO - > new ( - file = > " fasta_file_path " , - format = > " fasta " ) ; De Bio :: SeqIO module biedt naadloze opeenvolging verwerking . U kunt een reeks gebruiken met de volgende verklaring : $ retrievedsequence = $ sequenceobject - > next_seq , als volgt Je kunt lus door het object en ophalen van meerdere sequenties : while ( $ retrievedsequence = $ sequenceobject - > next_seq ) {print $ retrievedsequence - > seq , " \\ n " ; } 4 Pak de sequenties van het FASTA bestand met de " Biopieces " applicatie , die kader met daarin een set van modulaire tools voor het manipuleren van bioinformatica gegevens . Je loopt je Biopieces commando op de commandoregel read_fasta - i fasta_file | . Grijp - p sequence | write_fasta - o sequence_file - x Dit is een goede optie als je niet erg technisch geneigd , als kader kapselt veel van de programmering inspanning die nodig is om het FASTA bestand en de output van de passende sequenties te verwerken .
|