1. Nauka
  2. /
  3. Kursy
  4. /
  5. Segmentacja klientów w Pythonie

Connected

ćwiczenie

Oblicz sumę kwadratów błędów

W tym ćwiczeniu obliczysz sumę kwadratów błędów dla różnych liczb klastrów – od 1 do 15. W tym przykładzie korzystamy z niestandardowego zbioru danych, który pozwala uzyskać wyraźniejszy wykres łokcia.

Znormalizowana wersja danych została wczytana jako data_normalized. Moduł KMeans z biblioteki scikit-learn jest już zaimportowany. Zainicjalizowaliśmy również pusty słownik do przechowywania sumy kwadratów błędów: sse = {}.

Możesz swobodnie eksplorować dane w konsoli.

Instrukcje

100 XP
  • Dopasuj KMeans i oblicz SSE dla każdego k z zakresu od 1 do 15.
  • Zainicjalizuj KMeans z k klastrami i stanem losowym 1.
  • Dopasuj KMeans na znormalizowanym zbiorze danych.
  • Przypisz sumę kwadratów odległości do elementu k słownika sse.