Segmentace zákazníků pomocí k-means clusteringu

V tomto cvičení sestavíš segmentaci zákazníků pomocí algoritmu KMeans. Jak jsi zjistil/a v předchozím kroku, matematicky optimální počet clusterů se pohybuje někde mezi 3 a 4. Tady vytvoříš model se 4 segmenty.

Předpřipravená datová sada je načtena jako wholesale_scaled_df. Použiješ ji ke spuštění algoritmu KMeans, a surovou nepředzpracovanou datovou sadu jako wholesale – tu pak využiješ k prozkoumání průměrných hodnot sloupců pro 4 segmenty, které vytvoříš.

Importuj algoritmus KMeans z modulu sklearn.cluster.
Inicializuj algoritmus KMeans se 4 clustery a nastav náhodný stav na 123.
Natrénuj model na předpřipravené datové sadě wholesale_scaled_df.
Přiřaď vygenerované popisky do nového sloupce segment v surové datové sadě wholesale.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení