1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza skupień w Pythonie

Connected

ćwiczenie

Jednolite wzorce grupowania

Teraz, gdy znasz już wpływ ziaren losowości, przyjrzyjmy się tendencji algorytmu k-means do tworzenia jednorodnych skupień.

W tym ćwiczeniu użyjemy zbioru danych przypominającego mysz. Taki zbiór danych to grupa punktów ułożonych w kształt głowy myszy: trzy skupienia punktów rozmieszczone w okręgach – jedno odpowiada twarzy, a dwa pozostałe uszom myszy.

Oto jak wygląda typowy zbiór danych w kształcie myszy (źródło).

Dane są przechowywane w DataFrame biblioteki pandas o nazwie mouse. x_scaled i y_scaled to nazwy kolumn zawierających znormalizowane współrzędne X i Y punktów danych.

Instrukcje

100 XP
  • Zaimportuj funkcje kmeans i vq z biblioteki SciPy.
  • Wyznacz centra skupień za pomocą funkcji kmeans(), określając trzy skupienia.
  • Utwórz etykiety skupień za pomocą funkcji vq(), używając wyznaczonych powyżej centrów skupień.