FIFA 18 : explorer les défenseurs
Dans le jeu de données FIFA 18, divers attributs des joueurs sont présents. Deux de ces attributs sont :
- sliding tackle : un nombre entre 0 et 99 qui indique à quel point un joueur réussit ses tacles glissés
- aggression : un nombre entre 0 et 99 qui traduit l'engagement et la combativité d'un joueur
Ces valeurs sont généralement élevées chez les joueurs à vocation défensive. Dans cet exercice, vous allez réaliser un clustering à partir de ces attributs.
Ces données comportent 5000 lignes et sont nettement plus volumineuses que les précédents jeux de données. L'exécution d'un clustering hiérarchique peut prendre jusqu'à 10 secondes.
Les modules suivants sont préchargés : dendrogram, linkage, fcluster depuis scipy.cluster.hierarchy, matplotlib.pyplot sous l'alias plt, seaborn sous l'alias sns. Les données sont stockées dans un DataFrame pandas, fifa.
Cet exercice fait partie du cours
Analyse de clusters en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit the data into a hierarchical clustering algorithm
distance_matrix = ____(fifa[[____, ____]], 'ward')