Explorer les branches coupées de l’arbre
La fonction cutree() que vous avez utilisée aux exercices 5 et 6 peut aussi servir à couper un arbre à une hauteur donnée via le paramètre h. Prenez un moment pour explorer les clusters que vous avez générés dans les exercices précédents aux hauteurs 20 et 40.
Cet exercice fait partie du cours
Analyse de clusters avec R
Instructions
- Créez le vecteur d’affectation de clusters
clusters_h20aveccutree()en utilisanth = 20. - Ajoutez les affectations de cluster comme une colonne
clusterau data framelineupet enregistrez le résultat dans un nouveau data frame appelélineup_h20_complete. - Répétez les deux étapes ci-dessus pour une hauteur de 40, en générant les variables
clusters_h40etlineup_h40_complete. - Utilisez ggplot2 pour créer un nuage de points, coloré selon l’affectation au cluster pour les deux hauteurs.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
dist_players <- dist(lineup, method = 'euclidean')
hc_players <- hclust(dist_players, method = "complete")
# Calculate the assignment vector with a h of 20
clusters_h20 <- ___
# Create a new data frame storing these results
lineup_h20_complete <- mutate(lineup, cluster = ___)
# Calculate the assignment vector with a h of 40
clusters_h40 <- ___
# Create a new data frame storing these results
lineup_h40_complete <- ___
# Plot the positions of the players and color them using their cluster for height = 20
ggplot(___, aes(x = ___, y = ___, color = factor(___))) +
geom_point()
# Plot the positions of the players and color them using their cluster for height = 40