Regrouper les échantillons par clustering
Une autre façon d'évaluer la similarité entre des échantillons est le clustering hiérarchique. Ce processus comporte deux étapes. D'abord, vous calculez la distance entre les échantillons à partir de la couverture (normalisée) des pics avec la fonction dist(). Ensuite, vous utilisez ces distances par paires pour regrouper les échantillons similaires avec hclust(). Cela produit un dendrogramme qui représente la relation hiérarchique entre les échantillons.
Une matrice contenant des données de couverture correctement normalisées est disponible sous forme d'objet R cover.
Cet exercice fait partie du cours
ChIP-seq avec Bioconductor en R
Instructions
- Calculez les distances par paires entre les échantillons avec
dist(). - Utilisez
hclust()pour créer un dendrogramme à partir de la matrice de distances. - Affichez le dendrogramme.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute the pairwise distances between samples using `dist`
cover_dist <- ___(t(cover))
# Use `hclust()` to create a dendrogram from the distance matrix
cover_dendro <- ___(cover_dist)
# Plot the dendrogram
plot(___)