Format FASTQ

Format FASTQ merupakan format berbasis teks untuk meyimpan sekuen data biologi (nukleotida) dan nilai kualitasnya. Hal ini berbeda dengan format FASTA yang hanya menuliskan sekuen data biologi. Nilai kualitas dari sekuen ditulis dalam deret ASCII. Format ini pertama kali dikembangkan oleh Wellcome Trust Sanger Institute untuk menyatukan FASTA dan nilai kualitasnya, tetapi saat ini telah digunakan oleh untuk menyimpan hasil sekuensing dari Illumina.[1]

Format

Berkas FASTQ memiliki format sebagai berikut:

  • Baris pertama dimulai dengan simbol @ dan diikuti dengan pengenal sekuen, seperti berkas FASTA pada umumnya.[1]
  • Baris kedua diisi dengan sekuen nukleotida.[1]
  • Baris ketiga dimulai dengan simbol + dan umumnya diisi seperti baris pertama, tetapi ini hanyalah sebuah opsi.[1]
  • Baris keempat diisi dengan kualitas sekuen dari baris kedua.[1]

Referensi

  1. ^ a b c d e (Inggris) Cock et al (2009) The Sanger FASTQ file format for sequences with quality scores, and the Solexa/Illumina FASTQ variants. Nucleic Acids Research, DOI:10.1093/nar/gkp1137
Kembali kehalaman sebelumnya