Annotare i picchi
Negli esercizi precedenti, hai creato una tabella con i picchi uniti da tutti i campioni (disponibile qui come peaks_merged) e una tabella con le annotazioni geniche (disponibile come human_genes). Ora è il momento di combinare le informazioni di entrambe le tabelle usando la funzione annoPeaks() fornita dal pacchetto ChIPpeakAnno. Per ogni picco sufficientemente vicino al sito di inizio di un gene (come determinato dall'argomento bindingRegion), questa funzione restituirà in un data frame informazioni dettagliate sul gene in questione. Tra queste, c'è una colonna, insideFeature, che indica dove si trova il picco rispetto al gene.
Questo esercizio fa parte del corso
ChIP-seq con Bioconductor in R
Istruzioni dell'esercizio
- Annota i picchi con il gene più vicino.
- Determina il numero di picchi che sono stati annotati con geni.
- Crea una tabella di riepilogo che indichi dove si trovavano i picchi rispetto ai geni.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Annotate peaks with closest gene
peak_anno <- ___(peaks_merged, human_genes, bindingType="startSite", bindingRegion=c(-5000,5000))
# How many peaks were found close to genes?
length(___)
# Where are peaks located relative to genes?
table(peak_anno$___)