ComenzarEmpieza gratis

Eliminar regiones en la blacklist

Identificar y eliminar picos en regiones en la blacklist es un paso importante para preparar los datos para análisis posteriores. En este ejercicio, usamos la blacklist incluida en el paquete ChIPQC. También está disponible directamente en ENCODE.

Para este ejercicio, las llamadas de picos están en peaks, los datos de cobertura en cover y las regiones en la blacklist en blacklist.hg19. La función findOverlaps() te será útil aquí. Ya te has encontrado con el concepto de regiones solapadas en el curso introductorio de Bioconductor y volveremos a tratarlo más adelante en este capítulo.

Cargar todos los datos y paquetes de R necesarios puede tardar un momento. Ten paciencia, por favor.

Este ejercicio forma parte del curso

ChIP-seq con Bioconductor en R

Ver curso

Instrucciones del ejercicio

  • Encuentra todos los solapamientos entre los picos y las regiones en la blacklist.
  • Representa la cobertura de lecturas, las llamadas de picos y las regiones en la blacklist usando Gviz.
  • Elimina todos los picos en la blacklist.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Find all overlaps between peaks and blacklisted regions
blacklisted <- ___(peaks, blacklist.hg19, type="within")

# Create a plot to display read coverage together with peak calls and blacklisted regions in the selected region
cover_track <- ___(cover, window=10500, type="polygon", name="Coverage",
                         fill.mountain=c("lighgrey", "lightgrey"), col.mountain="grey")

# Calculate peak_track and region_track, plot plotTracks
peak_track <- ___(peaks, name="Peaks", fill="orange")
region_track <- ___(region, name="Blacklist")
plotTracks(list(ideogram, cover_track, peak_track, region_track, GenomeAxisTrack()),
           chromosome="chr21", from=start(region)-1000, to=end(region)+1000)

# Remove all blacklisted peaks
clean_peaks <- ___[-from(blacklisted)]
Editar y ejecutar código