Rimozione delle regioni in blacklist
Identificare e rimuovere i picchi nelle regioni in blacklist è un passaggio importante per preparare i dati alle analisi successive. In questo esercizio useremo la blacklist inclusa nel pacchetto ChIPQC. È disponibile anche direttamente da ENCODE.
Per questo esercizio, le chiamate di picco sono in peaks, i dati di coverage in cover e le regioni in blacklist in blacklist.hg19. Qui ti sarà utile la funzione findOverlaps(). Hai già incontrato il concetto di regioni sovrapposte nel corso introduttivo su Bioconductor e lo riprenderemo più avanti in questo capitolo.
Il caricamento di tutti i dati e dei pacchetti R necessari potrebbe richiedere qualche istante. Abbi pazienza.
Questo esercizio fa parte del corso
ChIP-seq con Bioconductor in R
Istruzioni dell'esercizio
- Trova tutte le sovrapposizioni tra i picchi e le regioni in blacklist.
- Rappresenta la coverage delle letture, le chiamate di picco e le regioni in blacklist usando Gviz.
- Rimuovi tutti i picchi in blacklist.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Find all overlaps between peaks and blacklisted regions
blacklisted <- ___(peaks, blacklist.hg19, type="within")
# Create a plot to display read coverage together with peak calls and blacklisted regions in the selected region
cover_track <- ___(cover, window=10500, type="polygon", name="Coverage",
fill.mountain=c("lighgrey", "lightgrey"), col.mountain="grey")
# Calculate peak_track and region_track, plot plotTracks
peak_track <- ___(peaks, name="Peaks", fill="orange")
region_track <- ___(region, name="Blacklist")
plotTracks(list(ideogram, cover_track, peak_track, region_track, GenomeAxisTrack()),
chromosome="chr21", from=start(region)-1000, to=end(region)+1000)
# Remove all blacklisted peaks
clean_peaks <- ___[-from(blacklisted)]