Aan de slagGa gratis aan de slag

Hiërarchische clustering: complete-methode

Voor de derde en laatste keer gebruiken we dezelfde footfall-gegevensset en kijken we of er veranderingen optreden als we een andere methode voor clustering gebruiken.

De gegevens staan in een pandas DataFrame, comic_con. x_scaled en y_scaled zijn de kolomnamen van de gestandaardiseerde X- en Y-coördinaten van mensen op een bepaald moment.

Deze oefening maakt deel uit van de cursus

Clusteranalyse in Python

Cursus bekijken

Oefeninstructies

  • Importeer fcluster en linkage uit scipy.cluster.hierarchy.
  • Gebruik de complete-methode in de functie .linkage().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the fcluster and linkage functions
____

# Use the linkage() function
distance_matrix = ____(____, ____, ____)

# Assign cluster labels
comic_con['cluster_labels'] = ____

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Code bewerken en uitvoeren