1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza skupień w R

Connected

ćwiczenie

Segmentacja klientów hurtowni

Czas wykorzystać klasteryzację hierarchiczną do segmentacji rynku – czyli do grupowania klientów w podgrupy na podstawie ich cech konsumenckich.

W tym ćwiczeniu dysponujesz danymi o wydatkach 45 różnych klientów hurtowni spożywczej w kategoriach: Mleko, Artykuły spożywcze i Mrożonki. Dane te są przechowywane w ramce danych customers_spend. Przypisz tych klientów do sensownych klastrów.

Uwaga: W tym ćwiczeniu możesz przyjąć, że skalowanie danych nie jest konieczne – wszystkie wartości reprezentują ten sam typ informacji (wydane kwoty).

Instrukcje

100 XP
  • Oblicz odległość euklidesową między klientami i zapisz wynik w zmiennej dist_customers.
  • Przeprowadź klasteryzację hierarchiczną metodą complete i zapisz wynik w hc_customers.
  • Narysuj dendrogram.
  • Utwórz wektor przypisań do klastrów, używając wysokości 15 000, i zapisz go jako clust_customers.
  • Wygeneruj nową ramkę danych segment_customers, dołączając wektor przypisań jako kolumnę cluster do oryginalnej ramki danych customers_spend.