Hauteur de l’arbre
Un avantage des méthodes de clustering comme le clustering hiérarchique est que vous pouvez décrire les relations entre vos observations à partir de la métrique de distance et du critère de liaison choisis (dont la combinaison définit la hauteur de l’arbre).
D’après le code ci-dessous, que pouvez-vous dire concrètement de la hauteur d’une branche dans le dendrogramme obtenu ?
dist_players <- dist(lineup, method = 'euclidean')
hc_players <- hclust(dist_players, method = 'single')
plot(hc_players)
Toutes les observations reliées par cette branche doivent avoir :
Cet exercice fait partie du cours
Analyse de clusters avec R
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice