1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza skupień w R

Connected

ćwiczenie

Powrót do danych hurtowych: eksploracja

Z poprzedniej analizy wynika, że k = 2 daje najwyższą średnią szerokość sylwetki. W tym ćwiczeniu będziesz kontynuować analizę danych klientów hurtowych – zbudujesz i zbadasz model k-means z 2 skupieniami.

Instrukcje

100 XP
  • Zbuduj model k-means o nazwie model_customers dla danych customers_spend, używając funkcji kmeans() z parametrem centers = 2.
  • Wyodrębnij wektor przypisań do skupień z modelu model_customers$cluster i zapisz go w zmiennej clust_customers.
  • Dodaj przypisania do skupień jako kolumnę cluster do ramki danych customers_spend i zapisz wynik do nowej ramki danych o nazwie segment_customers.
  • Oblicz rozmiar każdego skupienia, używając funkcji count().