ComeçarComece de graça

Removendo regiões em blacklist

Identificar e remover picos em regiões em blacklist é uma etapa importante para preparar os dados para análises posteriores. Neste exercício, usamos a blacklist incluída no pacote ChIPQC. Ela também está disponível diretamente no ENCODE.

Para este exercício, as chamadas de pico estão em peaks, os dados de cobertura estão em cover e as regiões em blacklist estão em blacklist.hg19. A função findOverlaps() será útil aqui. Você já viu o conceito de regiões sobrepostas no curso introdutório de Bioconductor, e vamos retomá-lo mais adiante neste capítulo.

Carregar todos os dados e pacotes R necessários pode levar um instante. Por favor, seja paciente.

Este exercício faz parte do curso

ChIP-seq com Bioconductor em R

Ver curso

Instruções do exercício

  • Encontre todas as sobreposições entre picos e regiões em blacklist.
  • Trace a cobertura de leituras, as chamadas de pico e as regiões em blacklist usando o Gviz.
  • Remova todos os picos em blacklist.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Find all overlaps between peaks and blacklisted regions
blacklisted <- ___(peaks, blacklist.hg19, type="within")

# Create a plot to display read coverage together with peak calls and blacklisted regions in the selected region
cover_track <- ___(cover, window=10500, type="polygon", name="Coverage",
                         fill.mountain=c("lighgrey", "lightgrey"), col.mountain="grey")

# Calculate peak_track and region_track, plot plotTracks
peak_track <- ___(peaks, name="Peaks", fill="orange")
region_track <- ___(region, name="Blacklist")
plotTracks(list(ideogram, cover_track, peak_track, region_track, GenomeAxisTrack()),
           chromosome="chr21", from=start(region)-1000, to=end(region)+1000)

# Remove all blacklisted peaks
clean_peaks <- ___[-from(blacklisted)]
Editar e executar o código