1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Segmentace zákazníků v Pythonu

Connected

cvičení

Výpočet součtu čtverců chyb

V tomto cvičení vypočítáš součet čtverců chyb (SSE) pro různé počty clusterů v rozsahu od 1 do 15. Pracujeme zde s vlastní vytvořenou datovou sadou, aby byl „loket" na grafu lépe viditelný.

Normalizovaná verze dat je načtena jako data_normalized. Modul KMeans ze scikit-learn je už naimportovaný. Také jsme připravili prázdný slovník pro ukládání součtů čtverců chyb: sse = {}.

Data si klidně prozkoumej v konzoli.

Pokyny

100 XP
  • Natrénuj KMeans a vypočítej SSE pro každé k v rozsahu od 1 do 15.
  • Inicializuj KMeans s k clustery a náhodným stavem 1.
  • Natrénuj KMeans na normalizované datové sadě.
  • Přiřaď součet čtverců vzdáleností k prvku k ve slovníku sse.