1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Mixture Models v R

Connected

cvičení

Prozkoumej data o pohlaví

Data gender obsahují hodnoty Weight (váha), Height (výška) a index BMI pro 10 000 osob. Původní data obsahují štítek Gender pro 5 000 osob, které se identifikují jako ženy, a 5 000 osob, které se identifikují jako muži. Tyto štítky se budou hodit později při testování, jak dobře shlukování odpovídá skutečným označením. V této podmnožině dat ale štítky nejsou k dispozici.

Data gender_with_probs navíc obsahují pravděpodobnosti příslušnosti každého datového bodu k určitému shluku. Protože nás zajímají dva shluky, pravděpodobnosti blízké 1 odpovídají jednomu shluku a blízké 0 druhému.

Cílem tohoto cvičení je podívat se, jak typická datová sada pro shlukování vypadá před shlukováním i po něm.

Pokyny

100 XP
  • Pomocí funkce head zobraz prvních 6 pozorování z gender.
  • Pomocí funkce head zobraz prvních 6 pozorování z gender_with_probs.
  • Vytvoř bodový graf s Weight na ose x a BMI na ose y. Obarvi body podle jejich pravděpodobnosti.