1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza skupień w R

Connected

ćwiczenie

Wiele wartości k, wiele modeli

W zbiorze danych lineup optymalna wartość k jest znana z góry, jednak w praktyce często tak nie jest – trzeba ją dopiero oszacować.

W tym ćwiczeniu skorzystasz z funkcji map_dbl() z biblioteki purrr, aby uruchomić algorytm k-means dla wartości k od 1 do 10 i wyodrębnić z każdego modelu metrykę całkowitej sumy kwadratów wewnątrz klastrów. To pierwszy krok do wizualizacji wykresu łokcia.

Instrukcje

100 XP
  • Użyj map_dbl(), aby uruchomić kmeans() na danych lineup dla wartości k od 1 do 10 i wyodrębnić z każdego modelu wartość całkowitej sumy kwadratów wewnątrz klastrów: model$tot.withinss. Zapisz wynikowy wektor jako tot_withinss.
  • Zbuduj nową ramkę danych elbow_df zawierającą wartości k oraz wektor całkowitych sum kwadratów wewnątrz klastrów.