Een FASTA formaat bestand bevat een of meer sequenties van nucleotiden in DNA . De FASTA formaat ontstaan met de FASTA softwarepakket voor DNA- sequencing , maar het is uitgegroeid tot een standaard formaat voor de weergave van DNA-sequenties in de bioinformatica . FASTA is een eenvoudig formaat, dat maakt sequenties makkelijk te ontleden met behulp van scripttalen zoals Perl en Python . Overzicht De basis van een dossier is een regel die begint met het " > " teken , gevolgd door de tekst identificeren van de oorsprong van de reeks. De kopregel is meestal minder dan 80 tekens . De lijn volgt deze kopregel bevat een reeks personages die nucleotiden in DNA of aminozuur residuen in een peptide sequentie . Toegestaan DNA Karakters Alleen zinvolle tekens toegestaan als onderdeel van een FASTA sequence . Sequenties kunnen bestaan uit A , C , T, G of U, overeenkomend met de nucleotiden adenosine , cytosine , thymidine , guanine of uracil respectievelijk . Echter, de precieze identiteit van de nucleotide niet altijd present sequencing . FASTA bevat ook codes voor de mogelijke nucleotiden wanneer de onzekerheid aanwezig is . De code N wordt gebruikt wanneer er geen bepaling worden gemaakt en X wanneer de nucleotide wordt gemaskeerd door andere moleculen . De " - " code wordt gebruikt om een gat van onbepaalde duur vertegenwoordigen toegestaan Peptide Karakters Een alfanumerieke code kan ook worden gebruikt om te vertegenwoordigen . de 24 aminozuren aanwezig in een peptidesequentie . Indien een peptide kan worden bepaald , wordt de code X wordt gebruikt , eveneens een DNA -sequentie . Een " * " wordt gebruikt om het uiteinde of translatie- sequentie van een peptide te geven. A " - " . Wordt ook gebruikt om een gat in sequencing data voor peptiden vertegenwoordigen Overige informatie De NCBI zet een standaard sequentie ID , of SEQID , voor gebruik in FASTA header lijnen , al is er geen definitieve standaard voor opname in de FASTA kopregel . Een FASTA bestand met meerdere sequenties staat bekend als een multi - FASTA bestand . FASTA bestanden kunnen de bestandsextensie hebben " . Fasta , ' " . Fna , ' " . FFN , ' " . Faa , ' " . Frn " of " . Fas . " < Br >
|