Clusters groeperen
Een lopende enquête uit 2016 wil peilen naar attitudes rond mentale gezondheid op de techwerkvloer en de frequentie van mentale aandoeningen onder techmedewerkers onderzoeken. Het gaat om een online enquête voor deelnemers uit de techsector.
De gegevensset mh_survey bevat het gender van de respondent, de Amerikaanse staat waar ze wonen, US_state_live, en of ze via hun werkgever behandeling voor hun mentale gezondheid hebben gezocht, sought_treatment.
pandas en matplotlib.pylot zijn al voor je geïmporteerd als respectievelijk pd en plt.
Deze oefening maakt deel uit van de cursus
Enquètegegevens analyseren in Python
Oefeninstructies
- Deel de populatie op in clusters van
US_state_liveen bereken het aantal respondenten. - Maak een staafdiagram van het aantal respondenten per
US_state_live.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Group population into clusters and calculate respondents
groups = mh_survey.____(____)[____].____.reset_index()
groups.columns = ['US_state_live','count']
# Plot a bar graph of number of respondents by US_state_live
groups.____.____(____,y='count')
plt.show()