1. 学ぶ
  2. /
  3. コース
  4. /
  5. Segmentacja klientów w Pythonie

Connected

演習

Oblicz i zwizualizuj sumę kwadratów błędów

Teraz obliczysz sumę kwadratów błędów dla różnych liczb klastrów – od 1 do 10.

Skorzystasz ze znormalizowanych danych RFMT utworzonych w poprzednim ćwiczeniu, przechowywanych jako datamart_rfmt_normalized. Moduł KMeans z biblioteki scikit-learn jest już zaimportowany. Zainicjalizowaliśmy też pusty słownik do przechowywania sum kwadratów błędów: sse = {}.

Możesz swobodnie eksplorować dane w konsoli.

指示

100 XP
  • Zainicjalizuj KMeans z k klastrami i losowym ziarnem 1, a następnie dopasuj model do znormalizowanego zbioru danych.
  • Przypisz sumę kwadratów odległości do elementu k słownika sse.
  • Dodaj tytuł wykresu "The Elbow Method", etykietę osi X "k" oraz etykietę osi Y "SSE".
  • Wykreśl wartości SSE dla każdego k przechowanego jako klucz w słowniku.