ComeçarComece de graça

Anotando picos

Nos exercícios anteriores, você criou uma tabela com as chamadas de pico mescladas de todas as amostras (disponível aqui como peaks_merged) e uma tabela com anotações de genes (disponível como human_genes). Agora é hora de combinar as informações das duas tabelas usando a função annoPeaks() fornecida pelo pacote ChIPpeakAnno. Para cada pico suficientemente próximo ao sítio inicial de um gene (conforme determinado pelo argumento bindingRegion), essa função retorna, em um data frame, informações detalhadas sobre o gene em questão. Isso inclui uma coluna, insideFeature, que indica onde o pico está localizado em relação ao gene.

Este exercício faz parte do curso

ChIP-seq com Bioconductor em R

Ver curso

Instruções do exercício

  • Anote os picos com o gene mais próximo.
  • Determine o número de picos que foram anotados com genes.
  • Crie uma tabela-resumo indicando onde os picos estavam localizados em relação aos genes.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Annotate peaks with closest gene
peak_anno <- ___(peaks_merged, human_genes, bindingType="startSite", bindingRegion=c(-5000,5000))

# How many peaks were found close to genes?
length(___)

# Where are peaks located relative to genes?
table(peak_anno$___)
Editar e executar o código