1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cluster Analysis v R

Connected

Cvičení

K-means: Průměrné šířky silhouette

Hierarchické shlukování dalo 3 shluky a metoda lokte navrhuje 2. V tomto cvičení použij průměrné šířky silhouette, abys zjistil/a, jaká by měla být „nejlepší" hodnota k.

Pokyny

100 XP
  • Pomocí map_dbl() spusť pam() na datech oes pro hodnoty k od 2 do 10 a z každého modelu vyextrahuj hodnotu průměrné šířky silhouette: model$silinfo$avg.width. Výsledný vektor ulož jako sil_width.
  • Vytvoř nový datový rámec sil_df obsahující hodnoty k a vektor průměrných šířek silhouette.
  • Pomocí hodnot z sil_df vykresli spojnicový graf znázorňující vztah mezi k a průměrnou šířkou silhouette.