Agrupar muestras (clustering)
Otra forma de analizar las similitudes entre muestras es mediante el clustering jerárquico. Este proceso tiene dos etapas. Primero, tendrás que calcular la
distancia entre muestras a partir de la (cobertura normalizada) de los picos usando la función dist(). Luego podrás usar estas distancias por pares para agrupar las muestras similares
con hclust(). Esto generará un dendrograma que refleja la relación jerárquica entre las muestras.
Tienes disponible una matriz con datos de cobertura correctamente normalizados como el objeto de R cover.
Este ejercicio forma parte del curso
ChIP-seq con Bioconductor en R
Instrucciones del ejercicio
- Calcula las distancias por pares entre muestras usando
dist(). - Usa
hclust()para crear un dendrograma a partir de la matriz de distancias. - Representa el dendrograma.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Compute the pairwise distances between samples using `dist`
cover_dist <- ___(t(cover))
# Use `hclust()` to create a dendrogram from the distance matrix
cover_dendro <- ___(cover_dist)
# Plot the dendrogram
plot(___)