Annotation des pics
Dans les exercices précédents, vous avez créé une table de pics fusionnés pour tous les échantillons (disponible ici sous peaks_merged) et une table avec les annotations géniques (disponible sous human_genes). Il est maintenant temps de combiner les informations des deux tables à l’aide de la fonction annoPeaks() fournie par le package ChIPpeakAnno. Pour chaque pic suffisamment proche du site de démarrage d’un gène (défini par l’argument bindingRegion), cette fonction renverra, dans un data frame, des informations détaillées sur le gène concerné. Cela inclut une colonne, insideFeature, indiquant où se situe le pic par rapport au gène.
Cet exercice fait partie du cours
ChIP-seq avec Bioconductor en R
Instructions
- Annotez les pics avec le gène le plus proche.
- Déterminez le nombre de pics qui ont été annotés avec des gènes.
- Créez un tableau récapitulatif indiquant où les pics se situent par rapport aux gènes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Annotate peaks with closest gene
peak_anno <- ___(peaks_merged, human_genes, bindingType="startSite", bindingRegion=c(-5000,5000))
# How many peaks were found close to genes?
length(___)
# Where are peaks located relative to genes?
table(peak_anno$___)