CommencerCommencer gratuitement

Retirer les régions sur liste noire

Identifier et supprimer les pics situés dans des régions sur liste noire est une étape importante pour préparer les données à l’analyse. Pour cet exercice, nous utilisons la liste noire incluse dans le package ChIPQC. Elle est également disponible directement depuis ENCODE.

Pour cet exercice, les appels de pics sont dans peaks, les données de couverture dans cover, et les régions sur liste noire dans blacklist.hg19. La fonction findOverlaps() vous sera utile ici. Vous avez déjà rencontré la notion de régions qui se recoupent dans le cours d’introduction à Bioconductor et nous y reviendrons plus loin dans ce chapitre.

Le chargement de toutes les données et des packages R requis peut prendre un instant. Merci de patienter.

Cet exercice fait partie du cours

ChIP-seq avec Bioconductor en R

Afficher le cours

Instructions

  • Trouvez tous les recouvrements entre les pics et les régions sur liste noire.
  • Tracez la couverture des lectures, les appels de pics et les régions sur liste noire avec Gviz.
  • Supprimez tous les pics sur liste noire.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Find all overlaps between peaks and blacklisted regions
blacklisted <- ___(peaks, blacklist.hg19, type="within")

# Create a plot to display read coverage together with peak calls and blacklisted regions in the selected region
cover_track <- ___(cover, window=10500, type="polygon", name="Coverage",
                         fill.mountain=c("lighgrey", "lightgrey"), col.mountain="grey")

# Calculate peak_track and region_track, plot plotTracks
peak_track <- ___(peaks, name="Peaks", fill="orange")
region_track <- ___(region, name="Blacklist")
plotTracks(list(ideogram, cover_track, peak_track, region_track, GenomeAxisTrack()),
           chromosome="chr21", from=start(region)-1000, to=end(region)+1000)

# Remove all blacklisted peaks
clean_peaks <- ___[-from(blacklisted)]
Modifier et exécuter le code