Menghapus wilayah daftar hitam
Mengidentifikasi dan menghapus puncak pada wilayah daftar hitam merupakan langkah penting dalam menyiapkan data untuk analisis lebih lanjut. Untuk latihan ini, kita menggunakan daftar hitam yang disertakan dalam paket ChIPQC. Ini juga tersedia langsung dari ENCODE.
Untuk keperluan latihan ini, panggilan puncak tersedia di peaks, data cakupan ada di cover, dan wilayah daftar hitam ada di blacklist.hg19. Fungsi findOverlaps() akan berguna di sini. Anda telah mempelajari konsep wilayah yang saling tumpang tindih pada kursus pengantar Bioconductor dan kita akan meninjaunya kembali nanti di bab ini.
Mungkin perlu sedikit waktu untuk memuat semua data dan paket R yang diperlukan untuk latihan ini. Mohon bersabar.
Latihan ini adalah bagian dari kursus
ChIP-seq dengan Bioconductor di R
Petunjuk latihan
- Temukan semua pertumpang tindihan antara puncak dan wilayah daftar hitam.
- Plot cakupan pembacaan, panggilan puncak, dan wilayah daftar hitam menggunakan Gviz.
- Hapus semua puncak yang termasuk daftar hitam.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Find all overlaps between peaks and blacklisted regions
blacklisted <- ___(peaks, blacklist.hg19, type="within")
# Create a plot to display read coverage together with peak calls and blacklisted regions in the selected region
cover_track <- ___(cover, window=10500, type="polygon", name="Coverage",
fill.mountain=c("lighgrey", "lightgrey"), col.mountain="grey")
# Calculate peak_track and region_track, plot plotTracks
peak_track <- ___(peaks, name="Peaks", fill="orange")
region_track <- ___(region, name="Blacklist")
plotTracks(list(ideogram, cover_track, peak_track, region_track, GenomeAxisTrack()),
chromosome="chr21", from=start(region)-1000, to=end(region)+1000)
# Remove all blacklisted peaks
clean_peaks <- ___[-from(blacklisted)]