1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Marketing in Python

Connected

cvičení

Segmentace zákazníků pomocí k-means clusteringu

V tomto cvičení sestavíš segmentaci zákazníků pomocí algoritmu KMeans. Jak jsi zjistil/a v předchozím kroku, matematicky optimální počet clusterů se pohybuje někde mezi 3 a 4. Tady vytvoříš model se 4 segmenty.

Předpřipravená datová sada je načtena jako wholesale_scaled_df. Použiješ ji ke spuštění algoritmu KMeans, a surovou nepředzpracovanou datovou sadu jako wholesale – tu pak využiješ k prozkoumání průměrných hodnot sloupců pro 4 segmenty, které vytvoříš.

Pokyny

100 XP
  • Importuj algoritmus KMeans z modulu sklearn.cluster.
  • Inicializuj algoritmus KMeans se 4 clustery a nastav náhodný stav na 123.
  • Natrénuj model na předpřipravené datové sadě wholesale_scaled_df.
  • Přiřaď vygenerované popisky do nového sloupce segment v surové datové sadě wholesale.