1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie nienadzorowane w R

Connected

ćwiczenie

Wybór liczby skupień

W tym ćwiczeniu porównasz wyniki hierarchicznego modelu grupowania z rzeczywistymi diagnozami. Zazwyczaj podczas uczenia nienadzorowanego zmienna docelowa nie jest dostępna. W tym zbiorze danych jednak ją mamy – można ją więc wykorzystać do oceny jakości modelu grupowania.

W przypadku uczenia nadzorowanego – czyli gdy próbujesz przewidzieć jakąś zmienną docelową, która jest dostępna w oryginalnych danych – grupowanie w celu tworzenia nowych cech może, ale nie musi poprawiać skuteczności finalnego modelu. To ćwiczenie pomoże ci ocenić, czy grupowanie hierarchiczne dostarcza w tym przypadku obiecującej nowej cechy.

Instrukcje

100 XP

wisc.data, diagnosis, wisc.pr, pve i wisc.hclust są dostępne w twoim środowisku pracy.

  • Użyj funkcji cutree(), aby podzielić drzewo na 4 skupienia. Wynik przypisz do zmiennej wisc.hclust.clusters.
  • Użyj funkcji table(), aby porównać przynależność do skupień z rzeczywistymi diagnozami.