1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w marketingu w Pythonie

Connected

ćwiczenie

Wyznaczanie optymalnej liczby klastrów

W tym ćwiczeniu zastosujesz metodę kryterium łokcia, aby wyznaczyć optymalną liczbę klastrów – taką, przy której zmniejszenie sumy kwadratów błędów staje się marginalne. To ważny krok, który pozwala matematycznie oszacować punkt wyjścia do dalszych testów. Będziesz iterować po różnych wartościach k i uruchamiać algorytm KMeans dla każdej z nich, a następnie nanieść błędy na wykres względem wartości k, aby zidentyfikować „łokieć" – miejsce, w którym spadek błędów wyraźnie zwalnia.

Moduł KMeans jest wczytany z sklearn.cluster, biblioteka seaborn jako sns, a moduł matplotlib.pyplot jako plt. Przeskalowany zbiór danych jest dostępny jako wholesale_scaled_df w postaci ramki danych pandas.

Instrukcje

100 XP
  • Utwórz pusty słownik sse.
  • Dopasuj algorytm KMeans dla wartości k od 1 do 11 i zapisz błędy w słowniku sse.
  • Dodaj tytuł do wykresu.
  • Utwórz wykres punktowy z kluczami na osi X i wartościami na osi Y, a następnie wyświetl wykres.