Kara listeye alınmış bölgeleri kaldırma
Kara listeye alınmış bölgelerdeki tepe noktalarını belirleyip kaldırmak, veriyi ileri analiz için hazırlamada önemli bir adımdır. Bu egzersizde, kara listeyi ChIPQC paketinde yer alan sürümünden kullanıyoruz. Aynı listeye doğrudan ENCODE üzerinden de ulaşabilirsin.
Bu egzersiz için tepe çağrıları peaks içinde, kapsama verisi cover içinde ve kara listeye alınmış bölgeler blacklist.hg19 içinde hazır. Burada findOverlaps() fonksiyonu işine yarayacak. Çakışan bölgeler kavramıyla giriş Bioconductor kursunda karşılaşmıştın; bu bölümde tekrar ele alacağız.
Bu egzersiz için gerekli tüm verilerin ve R paketlerinin yüklenmesi biraz zaman alabilir. Lütfen sabırlı ol.
Bu egzersiz
R ile Bioconductor kullanarak ChIP-seq
kursunun bir parçasıdırEgzersiz talimatları
- Tepe noktaları ile kara listeye alınmış bölgeler arasındaki tüm çakışmaları bul.
- Okuma kapsamını, tepe çağrılarını ve kara listedeki bölgeleri Gviz ile görselleştir.
- Kara listedeki tüm tepe noktalarını kaldır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Find all overlaps between peaks and blacklisted regions
blacklisted <- ___(peaks, blacklist.hg19, type="within")
# Create a plot to display read coverage together with peak calls and blacklisted regions in the selected region
cover_track <- ___(cover, window=10500, type="polygon", name="Coverage",
fill.mountain=c("lighgrey", "lightgrey"), col.mountain="grey")
# Calculate peak_track and region_track, plot plotTracks
peak_track <- ___(peaks, name="Peaks", fill="orange")
region_track <- ___(region, name="Blacklist")
plotTracks(list(ideogram, cover_track, peak_track, region_track, GenomeAxisTrack()),
chromosome="chr21", from=start(region)-1000, to=end(region)+1000)
# Remove all blacklisted peaks
clean_peaks <- ___[-from(blacklisted)]