Regrouper les échantillons par clustering

Une autre façon d'évaluer la similarité entre des échantillons est le clustering hiérarchique. Ce processus comporte deux étapes. D'abord, vous calculez la distance entre les échantillons à partir de la couverture (normalisée) des pics avec la fonction dist(). Ensuite, vous utilisez ces distances par paires pour regrouper les échantillons similaires avec hclust(). Cela produit un dendrogramme qui représente la relation hiérarchique entre les échantillons. Une matrice contenant des données de couverture correctement normalisées est disponible sous forme d'objet R cover.

Cet exercice fait partie du cours

ChIP-seq avec Bioconductor en R

Afficher le cours

Instructions

Calculez les distances par paires entre les échantillons avec dist().
Utilisez hclust() pour créer un dendrogramme à partir de la matrice de distances.
Affichez le dendrogramme.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute the pairwise distances between samples using `dist`
cover_dist <- ___(t(cover))

# Use `hclust()` to create a dendrogram from the distance matrix
cover_dendro <- ___(cover_dist)

# Plot the dendrogram
plot(___)

Modifier et exécuter le code