Porównanie kmeans() i hclust()

Porównując grupowanie metodą k-średnich z grupowaniem hierarchicznym, zauważysz, że obie metody dają różne przypisania do klastrów. Wynika to z faktu, że oba algorytmy opierają się na różnych założeniach dotyczących struktury danych. W bardziej zaawansowanym kursie można by wybrać jeden model na podstawie jakości jego założeń, ale na razie wystarczy zaobserwować, że wyniki się różnią.

W tym ćwiczeniu porównasz wyniki obu modeli na zbiorze danych pokemon, żeby zobaczyć, czym się od siebie różnią.

Wyniki grupowania metodą k-średnich na danych pokemon (dla 3 klastrów) są zapisane jako km.pokemon. Model grupowania hierarchicznego, który utworzyłeś w poprzednim ćwiczeniu, jest nadal dostępny jako hclust.pokemon.

Używając funkcji cutree() na obiekcie hclust.pokemon, przypisz każdą obserwację do klastra. Przyjmij trzy klastry i zapisz wynik w wektorze o nazwie cut.pokemon.
Używając funkcji table(), porównaj przynależność do klastrów między obiema metodami. Pamiętaj, że dostęp do poszczególnych komponentów modelu k-średnich uzyskuje się za pomocą operatora $.

ćwiczenie

Porównanie kmeans() i hclust()

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie