CommencerCommencer gratuitement

K-means sur un terrain de football (partie 2)

Dans l’exercice précédent, vous avez utilisé avec succès l’algorithme k-means pour regrouper les deux équipes issues du data frame lineup. Cette fois, voyons ce qui se passe lorsque vous utilisez un k de 3.

Vous verrez que l’algorithme s’exécute toujours, mais est-ce vraiment pertinent dans ce contexte…

Cet exercice fait partie du cours

Analyse de clusters avec R

Afficher le cours

Instructions

  • Créez un modèle k-means appelé model_km3 pour les données lineup à l’aide de la fonction kmeans() avec centers = 3.
  • Extrayez le vecteur d’affectations de clusters du modèle model_km3$cluster et stockez-le dans la variable clust_km3.
  • Ajoutez les affectations de clusters comme colonne cluster au data frame lineup et enregistrez le résultat dans un nouveau data frame appelé lineup_km3.
  • Utilisez ggplot pour représenter les positions de chaque joueur sur le terrain et coloriez-les selon leur cluster.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Build a kmeans model
model_km3 <- ___

# Extract the cluster assignment vector from the kmeans model
clust_km3 <- ___

# Create a new data frame appending the cluster assignment
lineup_km3 <- ___

# Plot the positions of the players and color them using their cluster
ggplot(___, aes(x = ___, y = ___, color = factor(___))) +
  geom_point()
Modifier et exécuter le code