1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modele mieszane w R

Connected

ćwiczenie

Eksploracja danych dotyczących płci

Zbiór danych gender zawiera wartości Weight (waga), Height (wzrost) oraz indeksy BMI dla 10 000 osób. Oryginalne dane zawierają etykietę Gender dla 5 000 osób identyfikujących się jako kobiety i 5 000 jako mężczyźni. Etykiety te przydadzą się później do oceny, jak dobrze grupowanie wypada w porównaniu z rzeczywistymi przypisaniami. W tym podzbiorze danych etykiety jednak nie są dostępne.

Zbiór danych gender_with_probs zawiera dodatkowo prawdopodobieństwa przynależności każdego punktu do danego skupienia. Ponieważ interesują nas dwa skupienia, wartości bliskie 1 odpowiadają jednemu skupieniu, a bliskie 0 – drugiemu.

Celem tego ćwiczenia jest przyjrzenie się temu, jak typowy zbiór danych do grupowania wygląda przed grupowaniem i po nim.

Instrukcje

100 XP
  • Użyj funkcji head, aby wyświetlić pierwsze 6 obserwacji ze zbioru gender.
  • Użyj funkcji head, aby wyświetlić pierwsze 6 obserwacji ze zbioru gender_with_probs.
  • Utwórz wykres punktowy z Weight na osi x i BMI na osi y. Pokoloruj punkty według ich prawdopodobieństwa.