1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza skupień w Pythonie

Connected

ćwiczenie

Obserwacje Pokémonów: klastrowanie hierarchiczne

Kontynuujemy analizę obserwacji legendarnych Pokémonów z poprzedniego ćwiczenia. Przypomnij sobie wykres punktowy z poprzedniego ćwiczenia – udało się na nim zidentyfikować dwa obszary o dużym zagęszczeniu obserwacji. Sugeruje to, że punkty można podzielić na dwa klastry. W tym ćwiczeniu wyznaczysz dwa klastry obserwacji przy użyciu klastrowania hierarchicznego.

'x' i 'y' to kolumny ze współrzędnymi X i Y lokalizacji obserwacji, przechowywane w DataFrame o nazwie df. Do dyspozycji masz: matplotlib.pyplot jako plt, seaborn jako sns oraz pandas jako pd.

Instrukcje

100 XP
  • Zaimportuj biblioteki linkage i fcluster.
  • Użyj funkcji linkage(), aby obliczyć odległości metodą ward.
  • Wygeneruj etykiety klastrów dla każdego punktu danych, tworząc dwa klastry za pomocą funkcji fcluster().
  • Narysuj punkty przy użyciu seaborn i przypisz inny kolor każdemu klastrowi.