1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cluster Analysis v R

Connected

Cvičení

Zpět k velkoobchodním datům: průzkum

Z předchozí analýzy vyplynulo, že k = 2 dosahuje nejvyšší průměrné šířky silhouette. V tomto cvičení budeš pokračovat v analýze dat velkoobchodních zákazníků – vytvoříš a prozkoumáš model k-means se 2 shluky.

Pokyny

100 XP
  • Vytvoř model k-means s názvem model_customers pro data customers_spend pomocí funkce kmeans() s parametrem centers = 2.
  • Extrahuj vektor přiřazení shluků z modelu model_customers$cluster a ulož ho do proměnné clust_customers.
  • Přidej přiřazení shluků jako sloupec cluster do datového rámce customers_spend a výsledek ulož do nového datového rámce s názvem segment_customers.
  • Zjisti velikost každého shluku pomocí funkce count().