Cluster gruppieren
Eine laufende Umfrage aus dem Jahr 2016 soll Einstellungen zur psychischen Gesundheit am Arbeitsplatz in der Tech-Branche messen und untersuchen, wie häufig psychische Erkrankungen unter Tech-Beschäftigten auftreten. Es handelt sich um eine Online-Umfrage für Teilnehmende aus der Tech-Industrie.
Der Datensatz mh_survey enthält das gender der befragten Person, den US-Bundesstaat, in dem sie lebt, US_state_live, und ob sie über ihren Arbeitgeber eine Behandlung der psychischen Gesundheit in Anspruch genommen hat, sought_treatment.
pandas und matplotlib.pylot wurden bereits als pd bzw. plt importiert.
Diese Übung ist Teil des Kurses
Umfragedaten in Python analysieren
Anleitung zur Übung
- Teile die Grundgesamtheit in Cluster nach
US_state_liveein und berechne die Anzahl der Befragten. - Erstelle ein Balkendiagramm der Anzahl der Befragten nach
US_state_live.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Group population into clusters and calculate respondents
groups = mh_survey.____(____)[____].____.reset_index()
groups.columns = ['US_state_live','count']
# Plot a bar graph of number of respondents by US_state_live
groups.____.____(____,y='count')
plt.show()