Removendo regiões em blacklist
Identificar e remover picos em regiões em blacklist é uma etapa importante para preparar os dados para análises posteriores. Neste exercício, usamos a blacklist incluída no pacote ChIPQC. Ela também está disponível diretamente no ENCODE.
Para este exercício, as chamadas de pico estão em peaks, os dados de cobertura estão em cover e as regiões em blacklist estão em blacklist.hg19. A função findOverlaps() será útil aqui. Você já viu o conceito de regiões sobrepostas no curso introdutório de Bioconductor, e vamos retomá-lo mais adiante neste capítulo.
Carregar todos os dados e pacotes R necessários pode levar um instante. Por favor, seja paciente.
Este exercício faz parte do curso
ChIP-seq com Bioconductor em R
Instruções do exercício
- Encontre todas as sobreposições entre picos e regiões em blacklist.
- Trace a cobertura de leituras, as chamadas de pico e as regiões em blacklist usando o Gviz.
- Remova todos os picos em blacklist.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Find all overlaps between peaks and blacklisted regions
blacklisted <- ___(peaks, blacklist.hg19, type="within")
# Create a plot to display read coverage together with peak calls and blacklisted regions in the selected region
cover_track <- ___(cover, window=10500, type="polygon", name="Coverage",
fill.mountain=c("lighgrey", "lightgrey"), col.mountain="grey")
# Calculate peak_track and region_track, plot plotTracks
peak_track <- ___(peaks, name="Peaks", fill="orange")
region_track <- ___(region, name="Blacklist")
plotTracks(list(ideogram, cover_track, peak_track, region_track, GenomeAxisTrack()),
chromosome="chr21", from=start(region)-1000, to=end(region)+1000)
# Remove all blacklisted peaks
clean_peaks <- ___[-from(blacklisted)]