1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cluster Analysis v R

Connected

Cvičení

Analýza siluet

Analýza siluet ti umožňuje zjistit, jak dobře každé pozorování odpovídá svému přiřazenému shluku v porovnání s ostatními shluky. Tato metrika (šířka siluety) nabývá hodnot od -1 do 1 pro každé pozorování v datech a lze ji interpretovat takto:

  • Hodnoty blízké 1 naznačují, že pozorování dobře patří do přiřazeného shluku
  • Hodnoty blízké 0 naznačují, že pozorování leží na hranici mezi dvěma shluky
  • Hodnoty blízké -1 naznačují, že pozorování může být přiřazeno do nesprávného shluku

V tomto cvičení využiješ funkce pam() a silhouette() z knihovny cluster k provedení analýzy siluet a porovnání výsledků modelů s k = 2 a k = 3. Budeš dál pracovat s datasetem lineup.

Věnuj pozornost grafu siluet – patří každé pozorování jednoznačně do svého přiřazeného shluku pro k = 3?

Pokyny

100 XP
  • Vytvoř model k-means pam_k2 pomocí pam() s k = 2 na datech lineup.
  • Vykresli analýzu siluet pomocí plot(silhouette(model)).
  • Zopakuj první dva kroky pro k = 3 a model ulož jako pam_k3.
  • Než budeš pokračovat, pečlivě si prohlédni rozdíly mezi oběma grafy (zejména pozorování 3) pro pam_k3.