Clustering dei campioni
Un altro modo per osservare le somiglianze tra campioni è il clustering gerarchico. Questo processo prevede due fasi. Per prima cosa, devi calcolare la
distanza tra i campioni in base alla (copertura normalizzata) dei picchi usando la funzione dist(). Poi puoi usare queste distanze a coppie per raggruppare insieme i campioni simili
con hclust(). Otterrai un dendrogramma che cattura la relazione gerarchica tra i campioni.
Una matrice con dati di copertura opportunamente normalizzati è disponibile come oggetto R cover.
Questo esercizio fa parte del corso
ChIP-seq con Bioconductor in R
Istruzioni dell'esercizio
- Calcola le distanze a coppie tra i campioni usando
dist(). - Usa
hclust()per creare un dendrogramma a partire dalla matrice delle distanze. - Traccia il dendrogramma.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compute the pairwise distances between samples using `dist`
cover_dist <- ___(t(cover))
# Use `hclust()` to create a dendrogram from the distance matrix
cover_dendro <- ___(cover_dist)
# Plot the dendrogram
plot(___)