Eksploracja danych dotyczących płci

Zbiór danych gender zawiera wartości Weight (waga), Height (wzrost) oraz indeksy BMI dla 10 000 osób. Oryginalne dane zawierają etykietę Gender dla 5 000 osób identyfikujących się jako kobiety i 5 000 jako mężczyźni. Etykiety te przydadzą się później do oceny, jak dobrze grupowanie wypada w porównaniu z rzeczywistymi przypisaniami. W tym podzbiorze danych etykiety jednak nie są dostępne.

Zbiór danych gender_with_probs zawiera dodatkowo prawdopodobieństwa przynależności każdego punktu do danego skupienia. Ponieważ interesują nas dwa skupienia, wartości bliskie 1 odpowiadają jednemu skupieniu, a bliskie 0 – drugiemu.

Celem tego ćwiczenia jest przyjrzenie się temu, jak typowy zbiór danych do grupowania wygląda przed grupowaniem i po nim.

Użyj funkcji head, aby wyświetlić pierwsze 6 obserwacji ze zbioru gender.
Użyj funkcji head, aby wyświetlić pierwsze 6 obserwacji ze zbioru gender_with_probs.
Utwórz wykres punktowy z Weight na osi x i BMI na osi y. Pokoloruj punkty według ich prawdopodobieństwa.

ćwiczenie

Eksploracja danych dotyczących płci

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie