Attribuer l’appartenance aux clusters
Dans cet exercice, vous allez utiliser la fonction hclust() pour calculer les étapes de liaison itératives et la fonction cutree() pour extraire les affectations de clusters pour le nombre souhaité (k) de clusters.
On vous donne les positions de 12 joueurs au début d’un match de football à 6 contre 6. Elles sont stockées dans le data frame lineup.
Vous savez qu’il y a deux équipes dans ce match (k = 2). Utilisons les méthodes de clustering que vous avez apprises pour déterminer à quelle équipe appartient chaque joueur en fonction de sa position.
Notes :
- La méthode de liaison peut être passée via le paramètre method :
hclust(distance_matrix, method = "complete") - Rappelez-vous qu’au football, les équipes adverses commencent chacune dans leur moitié de terrain.
- Comme ces positions sont mesurées sur la même échelle, nous n’avons pas besoin de re‑mettre les données à l’échelle.
Cet exercice fait partie du cours
Analyse de clusters avec R
Instructions
- Calculez la matrice de distances euclidiennes
dist_playersentre les douze joueurs. - Effectuez le calcul de liaison complete pour le clustering hiérarchique à l’aide de
hclustet stockez le résultat danshc_players. - Construisez le vecteur d’affectation des clusters
clusters_k2aveccutree()en utilisantk = 2. - Ajoutez les affectations de clusters comme colonne
clusterau data framelineupet enregistrez le résultat dans un nouveau data frame appelélineup_k2_complete.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the Distance
dist_players <- ___
# Perform the hierarchical clustering using the complete linkage
hc_players <- ___
# Calculate the assignment vector with a k of 2
clusters_k2 <- ___
# Create a new data frame storing these results
lineup_k2_complete <- mutate(lineup, cluster = ___)