CommencerCommencer gratuitement

Vérifications de base sur les clusters

Dans le jeu de données FIFA 18, nous nous sommes concentrés sur les défenseurs dans les exercices précédents. Essayons maintenant de nous intéresser aux attributs offensifs d’un joueur. La vitesse (pac), le dribble (dri) et le tir (sho) sont des caractéristiques que l’on retrouve chez les joueurs à vocation offensive. Dans cet exercice, un clustering k-means a déjà été appliqué aux données en utilisant les valeurs normalisées de ces trois attributs. Effectuez quelques vérifications de base sur les clusters ainsi obtenus.

Les données sont stockées dans un DataFrame pandas, fifa. Les noms des colonnes normalisées sont présents dans une liste scaled_features. Les étiquettes de cluster sont stockées dans la colonne cluster_labels. Rappelez-vous que les méthodes .count() et .mean() de pandas vous aident à obtenir le nombre d’observations et la moyenne des observations dans un DataFrame.

Cet exercice fait partie du cours

Analyse de clusters en Python

Afficher le cours

Instructions

  • Affichez la taille des clusters en regroupant selon la colonne cluster_labels.
  • Affichez la valeur moyenne des salaires des joueurs dans chaque cluster. eur_wage est le nom de la colonne qui contient le salaire d’un joueur en euros.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print the size of the clusters
print(fifa.____(____)['ID'].count())

# Print the mean value of wages in each cluster
print(fifa.____(____)['eur_wage'].____())
Modifier et exécuter le code