1. 学ぶ
  2. /
  3. コース
  4. /
  5. Uczenie nienadzorowane w R

Connected

演習

Grupowanie metodą k-means i porównanie wyników

Jak już wiesz, istnieją dwa główne typy grupowania: hierarchiczne i metodą k-means.

W tym ćwiczeniu zbudujesz model grupowania k-means na danych dotyczących raka piersi z Wisconsin i porównasz wyniki z rzeczywistymi diagnozami oraz z wynikami swojego modelu grupowania hierarchicznego. Przyjrzyj się uważnie, jak dobrze każdy model rozdziela dwie klasy diagnoz i jak oba modele wypadają w porównaniu ze sobą.

指示

100 XP

wisc.data, diagnosis i wisc.hclust.clusters są nadal dostępne.

  • Utwórz model k-means na danych wisc.data i przypisz wynik do wisc.km. Pamiętaj, aby ustawić 2 grupy odpowiadające rzeczywistej liczbie klas diagnozy. Przeskaluj dane i uruchom algorytm 20 razy, by znaleźć dobrze działający model.
  • Użyj funkcji table(), aby porównać przynależność do grup w modelu k-means z rzeczywistymi diagnozami zawartymi w wektorze diagnosis. Jak dobrze k-means rozdziela dwie klasy diagnoz?
  • Użyj funkcji table(), aby porównać przynależność do grup w modelu k-means z modelem grupowania hierarchicznego. Przynależność do grup w modelu hierarchicznym jest przechowywana w wisc.hclust.clusters.