Regrouper selon la hauteur
Dans les exercices précédents, vous avez regroupé vos observations en un nombre prédéfini de groupes (k). Dans cet exercice, vous allez exploiter la représentation visuelle du dendrogramme pour regrouper vos observations en clusters à l’aide d’une hauteur maximale (h) en dessous de laquelle les clusters se forment.
Vous utiliserez la fonction color_branches() de la bibliothèque dendextend afin d’inspecter visuellement les clusters qui se forment à n’importe quelle hauteur le long du dendrogramme.
L’objet hc_players a été conservé de votre travail précédent sur les données de composition d’équipe de football.
Cet exercice fait partie du cours
Analyse de clusters avec R
Instructions
- Créez un objet dendrogramme
dend_playersà partir de votre résultathclustà l’aide de la fonctionas.dendrogram(). - Tracez le dendrogramme.
- À l’aide de la fonction
color_branches(), créez et tracez un nouveau dendrogramme avec des clusters colorés pour une hauteur de coupe de 20. - Répétez l’étape ci-dessus avec une hauteur de 40.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
library(dendextend)
dist_players <- dist(lineup, method = 'euclidean')
hc_players <- hclust(dist_players, method = "complete")
# Create a dendrogram object from the hclust variable
dend_players <- as.dendrogram(___)
# Plot the dendrogram
# Color branches by cluster formed from the cut at a height of 20 & plot
dend_20 <- color_branches(___, h = ___)
# Plot the dendrogram with clusters colored below height 20
# Color branches by cluster formed from the cut at a height of 40 & plot
dend_40 <- ___
# Plot the dendrogram with clusters colored below height 40