1. 学习
  2. /
  3. 课程
  4. /
  5. Analiza skupień w Pythonie

Connected

练习

Klasteryzacja hierarchiczna: metoda Warda

Czas na Comic-Con! To coroczna konwencja poświęcona komiksom, organizowana w największych miastach świata. Masz dane o frekwencji z zeszłego roku – czyli o liczbie osób przebywających na terenie konwencji w danym momencie. Chcesz wybrać lokalizację swojego stoiska tak, aby zmaksymalizować sprzedaż. Używając metody Warda, zastosuj klasteryzację hierarchiczną, aby znaleźć dwa główne punkty przyciągania odwiedzających.

Dane są przechowywane w DataFrame biblioteki pandas o nazwie comic_con. x_scaled i y_scaled to nazwy kolumn zawierających znormalizowane współrzędne X i Y osób w danym momencie.

说明

100 XP
  • Zaimportuj fcluster i linkage z scipy.cluster.hierarchy.
  • Użyj metody ward w funkcji linkage().
  • Przypisz etykiety klastrów, tworząc 2 płaskie klastry na podstawie distance_matrix.
  • Uruchom kod tworzący wykres, aby zobaczyć wyniki.