FIFA 18: verdedigers verkennen
In de FIFA 18-gegevensset staan verschillende attributen van spelers. Twee van die attributen zijn:
- sliding tackle: een getal tussen 0-99 dat aangeeft hoe nauwkeurig een speler een sliding kan inzetten
- aggression: een getal tussen 0-99 dat de inzet en wilskracht van een speler aangeeft
Deze waarden zijn vaak hoog bij verdedigend ingestelde spelers. In deze oefening ga je clusteren op basis van deze attributen in de data.
Deze data bevat 5000 rijen en is aanzienlijk groter dan eerdere gegevenssets. Het uitvoeren van hiërarchisch clusteren op deze data kan tot 10 seconden duren.
De volgende modules zijn vooraf geladen: dendrogram, linkage, fcluster uit scipy.cluster.hierarchy, matplotlib.pyplot als plt, seaborn als sns. De data staat in een pandas DataFrame, fifa.
Deze oefening maakt deel uit van de cursus
Clusteranalyse in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit the data into a hierarchical clustering algorithm
distance_matrix = ____(fifa[[____, ____]], 'ward')