Vérifications de base sur les clusters
Dans le jeu de données FIFA 18, nous nous sommes concentrés sur les défenseurs dans les exercices précédents. Essayons maintenant de nous intéresser aux attributs offensifs d’un joueur. La vitesse (pac), le dribble (dri) et le tir (sho) sont des caractéristiques que l’on retrouve chez les joueurs à vocation offensive. Dans cet exercice, un clustering k-means a déjà été appliqué aux données en utilisant les valeurs normalisées de ces trois attributs. Effectuez quelques vérifications de base sur les clusters ainsi obtenus.
Les données sont stockées dans un DataFrame pandas, fifa. Les noms des colonnes normalisées sont présents dans une liste scaled_features. Les étiquettes de cluster sont stockées dans la colonne cluster_labels. Rappelez-vous que les méthodes .count() et .mean() de pandas vous aident à obtenir le nombre d’observations et la moyenne des observations dans un DataFrame.
Cet exercice fait partie du cours
Analyse de clusters en Python
Instructions
- Affichez la taille des clusters en regroupant selon la colonne
cluster_labels. - Affichez la valeur moyenne des salaires des joueurs dans chaque cluster.
eur_wageest le nom de la colonne qui contient le salaire d’un joueur en euros.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print the size of the clusters
print(fifa.____(____)['ID'].count())
# Print the mean value of wages in each cluster
print(fifa.____(____)['eur_wage'].____())