1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Analýza dat z průzkumů v Pythonu

Connected

cvičení

Analýza clusterového vzorkování

Spolu se skupinou psychologů se věnuješ analýze duševního zdraví zaměstnanců. Součástí výzkumu je průzkum zaměřený na postoje k duševnímu zdraví na pracovišti v tech sektoru a na frekvenci výskytu duševních potíží mezi tech pracovníky.

Dataset mh_survey obsahuje sloupec gender s pohlavím respondenta, sloupec US_state_live s americkým státem, ve kterém respondent žije, a sloupec sought_treatment s informací o tom, zda respondent vyhledal pomoc s duševním zdravím prostřednictvím svého zaměstnavatele.

Vytvoříš výsečový graf, který znázorní pravděpodobnost, že tech pracovník v USA vyhledá pomoc s duševním zdravím – konkrétně sloupec sought_treatment. Náhodný seznam 10 klastrů států, random_cluster, je už nahraný za tebe.

Pandas a numpy jsou k dispozici jako pd a np.

Pokyny

100 XP
  • Vyfiltruj dataset tak, aby obsahoval pouze státy z random_clusters.
  • Vytvoř výsečový graf ze sloupce sought_treatment.