Hiërarchische clustering: complete-methode
Voor de derde en laatste keer gebruiken we dezelfde footfall-gegevensset en kijken we of er veranderingen optreden als we een andere methode voor clustering gebruiken.
De gegevens staan in een pandas DataFrame, comic_con. x_scaled en y_scaled zijn de kolomnamen van de gestandaardiseerde X- en Y-coördinaten van mensen op een bepaald moment.
Deze oefening maakt deel uit van de cursus
Clusteranalyse in Python
Oefeninstructies
- Importeer
fclusterenlinkageuitscipy.cluster.hierarchy. - Gebruik de
complete-methode in de functie.linkage().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the fcluster and linkage functions
____
# Use the linkage() function
distance_matrix = ____(____, ____, ____)
# Assign cluster labels
comic_con['cluster_labels'] = ____
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()