Aan de slagGa gratis aan de slag

FIFA 18: verdedigers verkennen

In de FIFA 18-gegevensset staan verschillende attributen van spelers. Twee van die attributen zijn:

  • sliding tackle: een getal tussen 0-99 dat aangeeft hoe nauwkeurig een speler een sliding kan inzetten
  • aggression: een getal tussen 0-99 dat de inzet en wilskracht van een speler aangeeft

Deze waarden zijn vaak hoog bij verdedigend ingestelde spelers. In deze oefening ga je clusteren op basis van deze attributen in de data.

Deze data bevat 5000 rijen en is aanzienlijk groter dan eerdere gegevenssets. Het uitvoeren van hiërarchisch clusteren op deze data kan tot 10 seconden duren.

De volgende modules zijn vooraf geladen: dendrogram, linkage, fcluster uit scipy.cluster.hierarchy, matplotlib.pyplot als plt, seaborn als sns. De data staat in een pandas DataFrame, fifa.

Deze oefening maakt deel uit van de cursus

Clusteranalyse in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Fit the data into a hierarchical clustering algorithm
distance_matrix = ____(fifa[[____, ____]], 'ward')
Code bewerken en uitvoeren