1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie nienadzorowane w R

Connected

ćwiczenie

Porównanie kmeans() i hclust()

Porównując grupowanie metodą k-średnich z grupowaniem hierarchicznym, zauważysz, że obie metody dają różne przypisania do klastrów. Wynika to z faktu, że oba algorytmy opierają się na różnych założeniach dotyczących struktury danych. W bardziej zaawansowanym kursie można by wybrać jeden model na podstawie jakości jego założeń, ale na razie wystarczy zaobserwować, że wyniki się różnią.

W tym ćwiczeniu porównasz wyniki obu modeli na zbiorze danych pokemon, żeby zobaczyć, czym się od siebie różnią.

Instrukcje

100 XP

Wyniki grupowania metodą k-średnich na danych pokemon (dla 3 klastrów) są zapisane jako km.pokemon. Model grupowania hierarchicznego, który utworzyłeś w poprzednim ćwiczeniu, jest nadal dostępny jako hclust.pokemon.

  • Używając funkcji cutree() na obiekcie hclust.pokemon, przypisz każdą obserwację do klastra. Przyjmij trzy klastry i zapisz wynik w wektorze o nazwie cut.pokemon.
  • Używając funkcji table(), porównaj przynależność do klastrów między obiema metodami. Pamiętaj, że dostęp do poszczególnych komponentów modelu k-średnich uzyskuje się za pomocą operatora $.