1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza skupień w Pythonie

Connected

ćwiczenie

K-means: pierwsze ćwiczenie

To ćwiczenie pozwoli ci zapoznać się z zastosowaniem algorytmu k-means na zbiorze danych. Wykorzystamy zbiór danych Comic Con i sprawdzimy, jak działa na nim grupowanie metodą k-means.

Przypomnienie dwóch kroków algorytmu k-means:

  • Wyznaczanie centroidów klastrów za pomocą funkcji kmeans(). Przyjmuje ona dwa wymagane argumenty: obserwacje oraz liczbę klastrów.
  • Przypisywanie etykiet klastrów za pomocą funkcji vq(). Przyjmuje ona dwa wymagane argumenty: obserwacje oraz centroidy klastrów.

Dane są przechowywane w ramce danych pandas o nazwie comic_con. x_scaled i y_scaled to nazwy kolumn ze znormalizowanymi współrzędnymi X i Y osób w danym momencie.

Instrukcje

100 XP
  • Zaimportuj funkcje kmeans i vq z biblioteki SciPy.
  • Wyznacz centroidy klastrów za pomocą funkcji kmeans(), tworząc dwa klastry.
  • Przypisz etykiety klastrów na podstawie wyznaczonych centroidów.