CommencerCommencer gratuitement

Attribuer l’appartenance aux clusters

Dans cet exercice, vous allez utiliser la fonction hclust() pour calculer les étapes de liaison itératives et la fonction cutree() pour extraire les affectations de clusters pour le nombre souhaité (k) de clusters.

On vous donne les positions de 12 joueurs au début d’un match de football à 6 contre 6. Elles sont stockées dans le data frame lineup.

Vous savez qu’il y a deux équipes dans ce match (k = 2). Utilisons les méthodes de clustering que vous avez apprises pour déterminer à quelle équipe appartient chaque joueur en fonction de sa position.

Notes :

  • La méthode de liaison peut être passée via le paramètre method : hclust(distance_matrix, method = "complete")
  • Rappelez-vous qu’au football, les équipes adverses commencent chacune dans leur moitié de terrain.
  • Comme ces positions sont mesurées sur la même échelle, nous n’avons pas besoin de re‑mettre les données à l’échelle.

Cet exercice fait partie du cours

Analyse de clusters avec R

Afficher le cours

Instructions

  • Calculez la matrice de distances euclidiennes dist_players entre les douze joueurs.
  • Effectuez le calcul de liaison complete pour le clustering hiérarchique à l’aide de hclust et stockez le résultat dans hc_players.
  • Construisez le vecteur d’affectation des clusters clusters_k2 avec cutree() en utilisant k = 2.
  • Ajoutez les affectations de clusters comme colonne cluster au data frame lineup et enregistrez le résultat dans un nouveau data frame appelé lineup_k2_complete.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate the Distance
dist_players <- ___

# Perform the hierarchical clustering using the complete linkage
hc_players <- ___

# Calculate the assignment vector with a k of 2
clusters_k2 <- ___

# Create a new data frame storing these results
lineup_k2_complete <- mutate(lineup, cluster = ___)
Modifier et exécuter le code