Okumaları filtreleme
Bu egzersizde, düşük kaliteli hizalamalara sahip okumaları çıkararak veriyi daha da temizleyeceksin. Bunu yapabilmek için BAM dosyasından hizalama kalite değerlerini yüklemen gerekiyor. Bu değerler mapq alanında saklanır.
Bu egzersiz
R ile Bioconductor kullanarak ChIP-seq
kursunun bir parçasıdırEgzersiz talimatları
- Her okuma için hizalama kalitesi bilgisini içerecek şekilde
readsnesnesini yükle. - Kalitesi en az 20 olan tüm hizalamaları belirle.
- Yüksek ve düşük kaliteli gruplar arasındaki hizalama kalite dağılımlarını karşılaştıran bir kutu grafiği (boxplot) oluştur.
- Düşük kaliteli tüm hizalamaları kaldır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load reads with mapping qualities by requesting the "mapq" entries
reads <- readGAlignments(bam_file, param=ScanBamParam(what=___))
# Identify good quality alignments
high_mapq <- mcols(reads)$mapq >= ___
# Examine mapping quality distribution for high and low quality alignments
___(mcols(reads)$mapq ~ high_mapq, xlab="good quality alignments", ylab="mapping quality")
# Remove low quality alignments
reads_good <- subset(reads, ___)