1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza skupień w R

Connected

ćwiczenie

Analiza sylwetkowa

Analiza sylwetkowa pozwala ocenić, jak bardzo każda obserwacja pasuje do przypisanego jej klastra w porównaniu z pozostałymi klastrami. Ta miara (szerokość sylwetki) przyjmuje wartości od -1 do 1 dla każdej obserwacji w zbiorze danych i można ją interpretować następująco:

  • Wartości bliskie 1 sugerują, że obserwacja dobrze pasuje do przypisanego klastra.
  • Wartości bliskie 0 sugerują, że obserwacja znajduje się na granicy między dwoma klastrami.
  • Wartości bliskie -1 sugerują, że obserwacja mogła zostać przypisana do niewłaściwego klastra.

W tym ćwiczeniu wykorzystasz funkcje pam() i silhouette() z biblioteki cluster, aby przeprowadzić analizę sylwetkową i porównać wyniki modeli dla k = 2 oraz k = 3. Będziesz nadal pracować ze zbiorem danych lineup.

Przyjrzyj się uważnie wykresowi sylwetkowemu – czy każda obserwacja wyraźnie należy do przypisanego klastra dla k = 3?

Instrukcje

100 XP
  • Zbuduj model k-medoidów pam_k2, używając funkcji pam() z parametrem k = 2 na danych lineup.
  • Narysuj wykres analizy sylwetkowej, wywołując plot(silhouette(model)).
  • Powtórz oba powyższe kroki dla k = 3, zapisując model jako pam_k3.
  • Zanim przejdziesz dalej, porównaj oba wykresy – zwróć szczególną uwagę na obserwację 3 w modelu pam_k3.