1. Learn
  2. /
  3. Courses
  4. /
  5. Segmentace zákazníků v Pythonu

Connected

Exercise

Výpočet a vizualizace součtu čtverců chyb

Teď vypočítáš součet čtverců chyb pro různé počty clusterů v rozsahu od 1 do 10.

Použiješ normalizovaná RFMT data vytvořená v předchozím cvičení, která jsou uložena jako datamart_rfmt_normalized. Modul KMeans z balíčku scikit-learn je již naimportován. Také jsme inicializovali prázdný slovník pro ukládání součtu čtverců chyb: sse = {}.

Klidně si data nejdřív prozkoumej v konzoli.

Instructions

100 XP
  • Inicializuj KMeans s k clustery a náhodným stavem 1 a přizpůsob KMeans na normalizovaný dataset.
  • Přiřaď součet čtverců vzdáleností k prvku k ve slovníku sse.
  • Přidej název grafu „The Elbow Method", popisek osy X „k" a popisek osy Y „SSE".
  • Vykresli hodnoty SSE pro každé k uložené jako klíče ve slovníku.