K-means sur un terrain de football (partie 2)
Dans l’exercice précédent, vous avez utilisé avec succès l’algorithme k-means pour regrouper les deux équipes issues du data frame lineup. Cette fois, voyons ce qui se passe lorsque vous utilisez un k de 3.
Vous verrez que l’algorithme s’exécute toujours, mais est-ce vraiment pertinent dans ce contexte…
Cet exercice fait partie du cours
Analyse de clusters avec R
Instructions
- Créez un modèle k-means appelé
model_km3pour les donnéeslineupà l’aide de la fonctionkmeans()aveccenters = 3. - Extrayez le vecteur d’affectations de clusters du modèle
model_km3$clusteret stockez-le dans la variableclust_km3. - Ajoutez les affectations de clusters comme colonne
clusterau data framelineupet enregistrez le résultat dans un nouveau data frame appelélineup_km3. - Utilisez ggplot pour représenter les positions de chaque joueur sur le terrain et coloriez-les selon leur cluster.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Build a kmeans model
model_km3 <- ___
# Extract the cluster assignment vector from the kmeans model
clust_km3 <- ___
# Create a new data frame appending the cluster assignment
lineup_km3 <- ___
# Plot the positions of the players and color them using their cluster
ggplot(___, aes(x = ___, y = ___, color = factor(___))) +
geom_point()