FIFA 18: Verteidiger erkunden
Im FIFA-18-Datensatz sind verschiedene Attribute der Spieler enthalten. Zwei davon sind:
- sliding tackle: eine Zahl zwischen 0–99, die angibt, wie präzise ein Spieler Grätschen ausführen kann
- aggression: eine Zahl zwischen 0–99, die das Engagement und den Willen eines Spielers ausdrückt
Diese Werte sind bei defensiv ausgerichteten Spielern typischerweise hoch. In dieser Übung führst du ein Clustering auf Basis dieser Attribute durch.
Diese Daten bestehen aus 5.000 Zeilen und sind deutlich größer als die vorherigen Datensätze. Hierarchisches Clustering kann darauf bis zu 10 Sekunden dauern.
Folgende Module sind vorab geladen: dendrogram, linkage, fcluster aus scipy.cluster.hierarchy, matplotlib.pyplot als plt, seaborn als sns. Die Daten liegen in einem pandas DataFrame fifa.
Diese Übung ist Teil des Kurses
Cluster Analysis in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit the data into a hierarchical clustering algorithm
distance_matrix = ____(fifa[[____, ____]], 'ward')