K-means: pierwsze ćwiczenie

To ćwiczenie pozwoli ci zapoznać się z zastosowaniem algorytmu k-means na zbiorze danych. Wykorzystamy zbiór danych Comic Con i sprawdzimy, jak działa na nim grupowanie metodą k-means.

Przypomnienie dwóch kroków algorytmu k-means:

Wyznaczanie centroidów klastrów za pomocą funkcji kmeans(). Przyjmuje ona dwa wymagane argumenty: obserwacje oraz liczbę klastrów.
Przypisywanie etykiet klastrów za pomocą funkcji vq(). Przyjmuje ona dwa wymagane argumenty: obserwacje oraz centroidy klastrów.

Dane są przechowywane w ramce danych pandas o nazwie comic_con. x_scaled i y_scaled to nazwy kolumn ze znormalizowanymi współrzędnymi X i Y osób w danym momencie.

Zaimportuj funkcje kmeans i vq z biblioteki SciPy.
Wyznacz centroidy klastrów za pomocą funkcji kmeans(), tworząc dwa klastry.
Przypisz etykiety klastrów na podstawie wyznaczonych centroidów.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie