Explorer les clusters
Comme l’analyse de clustering est toujours en partie qualitative, il est essentiel de disposer des bons outils pour explorer ses résultats.
Dans cet exercice, vous allez explorer le data frame que vous avez créé à l’exercice précédent : lineup_k2_complete.
Rappel : Le data frame lineup_k2_complete contient les positions x et y de 12 joueurs au début d’un match de football à 6 contre 6, auxquelles vous avez ajouté les attributions de clusters selon les paramètres suivants :
- Distance : Euclidienne
- Nombre de clusters (k) : 2
- Méthode de liaison : Complete
Cet exercice fait partie du cours
Analyse de clusters avec R
Instructions
- Avec
count()de dplyr, comptez le nombre de joueurs attribués à chaque cluster. - Avec
ggplot(), tracez les positions des joueurs et colorez-les selon leur cluster.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Count the cluster assignments
count(lineup_k2_complete, ___)
# Plot the positions of the players and color them using their cluster
ggplot(lineup_k2_complete, aes(x = ___, y = ___, color = factor(___))) +
geom_point()