Menjelajahi berkas fastq
Berkas fastq biasanya berisi ribuan hingga jutaan read, dan ukurannya dapat sangat besar! Untuk latihan ini, Anda akan menggunakan sub-sampel fastq kecil berisi 500 read, yang mudah dimuat ke memori dan dapat dibaca seluruhnya menggunakan fungsi readFastq().
Berkas sekuens asli berasal dari Arabidopsis thaliana, disediakan oleh UC Davis Genome Center. Nomor aksesinya adalah SRR1971253 dan diunduh dari Sequence Read Archive (SRA). Berkas ini berisi DNA dari jaringan daun, digabungkan dan disekuensing menggunakan Illumina HiSeq 2000. Sekuens ini merupakan single-read dengan panjang 50 pasangan basa (bp).
fqsample adalah objek ShortReadQ dan memuat informasi tentang read, skor kualitas, dan id. Sekarang giliran Anda untuk menjelajahinya!
Latihan ini adalah bagian dari kursus
Pengantar Bioconductor di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load ShortRead
___
# Print fqsample
___