IniziaInizia gratis

Rimozione delle regioni in blacklist

Identificare e rimuovere i picchi nelle regioni in blacklist è un passaggio importante per preparare i dati alle analisi successive. In questo esercizio useremo la blacklist inclusa nel pacchetto ChIPQC. È disponibile anche direttamente da ENCODE.

Per questo esercizio, le chiamate di picco sono in peaks, i dati di coverage in cover e le regioni in blacklist in blacklist.hg19. Qui ti sarà utile la funzione findOverlaps(). Hai già incontrato il concetto di regioni sovrapposte nel corso introduttivo su Bioconductor e lo riprenderemo più avanti in questo capitolo.

Il caricamento di tutti i dati e dei pacchetti R necessari potrebbe richiedere qualche istante. Abbi pazienza.

Questo esercizio fa parte del corso

ChIP-seq con Bioconductor in R

Visualizza il corso

Istruzioni dell'esercizio

  • Trova tutte le sovrapposizioni tra i picchi e le regioni in blacklist.
  • Rappresenta la coverage delle letture, le chiamate di picco e le regioni in blacklist usando Gviz.
  • Rimuovi tutti i picchi in blacklist.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Find all overlaps between peaks and blacklisted regions
blacklisted <- ___(peaks, blacklist.hg19, type="within")

# Create a plot to display read coverage together with peak calls and blacklisted regions in the selected region
cover_track <- ___(cover, window=10500, type="polygon", name="Coverage",
                         fill.mountain=c("lighgrey", "lightgrey"), col.mountain="grey")

# Calculate peak_track and region_track, plot plotTracks
peak_track <- ___(peaks, name="Peaks", fill="orange")
region_track <- ___(region, name="Blacklist")
plotTracks(list(ideogram, cover_track, peak_track, region_track, GenomeAxisTrack()),
           chromosome="chr21", from=start(region)-1000, to=end(region)+1000)

# Remove all blacklisted peaks
clean_peaks <- ___[-from(blacklisted)]
Modifica ed esegui il codice