Aan de slagGa gratis aan de slag

Hiërarchische clustering: single-methode

Laten we dezelfde footfall-gegevensset gebruiken en kijken of er veranderingen optreden als we een andere methode voor clustering gebruiken.

De data staat in een pandas DataFrame, comic_con. x_scaled en y_scaled zijn de kolomnamen van de gestandaardiseerde X- en Y-coördinaten van mensen op een bepaald moment.

Deze oefening maakt deel uit van de cursus

Clusteranalyse in Python

Cursus bekijken

Oefeninstructies

  • Importeer fcluster en linkage uit scipy.cluster.hierarchy.
  • Gebruik de methode single in de functie linkage().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the fcluster and linkage functions
from ____ import ____, ____

# Use the linkage() function
distance_matrix = ____(comic_con[[____, ____]], ____ = ____, metric = ____)

# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, ____)

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Code bewerken en uitvoeren