1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modele mieszane w R

Connected

ćwiczenie

Wizualizacja klastrów

Mamy już wszystko, czego potrzebujemy, żeby narysować obserwacje razem z elipsami reprezentującymi klastry.

Jeśli chcesz przypisać każdą obserwację do jednego z dwóch klastrów, możesz skorzystać z funkcji clusters() i porównać wyniki z prawdziwymi etykietami. Przypomnijmy: gdy do klastrowania danych używaliśmy tylko zmiennej Weight, poprawnie przewidzieliśmy 4500 kobiet i 4556 mężczyzn. Sprawdźmy, czy dodanie kolejnej zmiennej pozwoli lepiej rozdzielić klastry.

Instrukcje

100 XP
  • Użyj funkcji geom_point(), aby utworzyć wykres punktowy dla zmiennych Weight i BMI. Dodaj do wykresu dwie elipsy zapisane w ellipses_comp_number, korzystając z funkcji geom_path().
  • Pamiętaj, że elipsy muszą zostać przekształcone w ramkę danych.
  • Pokoloruj klaster 1 na czerwono, a klaster 2 na niebiesko.
  • Wyznacz tabelę częstości dla prawdziwych etykiet zapisanych w zmiennej Gender w porównaniu z etykietami przewidzianymi przez clusters.