Menyaring read
Dalam latihan ini, Anda akan membersihkan data lebih lanjut dengan menghapus read dengan penjajaran berkualitas rendah. Untuk dapat melakukannya, Anda perlu memuat kualitas penjajaran dari berkas BAM. Nilai ini disimpan pada kolom mapq.
Latihan ini adalah bagian dari kursus
ChIP-seq dengan Bioconductor di R
Petunjuk latihan
- Muat
readsdengan informasi tentang kualitas penjajaran yang terlampir pada setiap read. - Identifikasi semua penjajaran dengan kualitas setidaknya 20.
- Buat boxplot yang membandingkan sebaran kualitas penjajaran antara kelompok berkualitas tinggi dan rendah.
- Hapus semua penjajaran berkualitas rendah.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load reads with mapping qualities by requesting the "mapq" entries
reads <- readGAlignments(bam_file, param=ScanBamParam(what=___))
# Identify good quality alignments
high_mapq <- mcols(reads)$mapq >= ___
# Examine mapping quality distribution for high and low quality alignments
___(mcols(reads)$mapq ~ high_mapq, xlab="good quality alignments", ylab="mapping quality")
# Remove low quality alignments
reads_good <- subset(reads, ___)