Analyse par grappes (cluster sampling)
Vous et un groupe de psychologues souhaitez analyser la santé mentale des employés. Votre étude repose sur une enquête visant à mesurer les attitudes envers la santé mentale dans le secteur tech et à examiner la fréquence des troubles de santé mentale parmi les travailleurs de la tech.
Le jeu de données, mh_survey, inclut le gender de la personne répondante, l’État américain où elle vit, US_state_live, et le fait qu’elle ait cherché un traitement pour sa santé mentale via son employeur, sought_treatment.
Vous allez créer un diagramme circulaire pour analyser la probabilité qu’un·e travailleur·se de la tech aux États-Unis cherche un traitement pour sa santé mentale, sought_treatment.
Une liste aléatoire de 10 grappes d’États, random_cluster, a été téléchargée pour vous.
Pandas et numpy ont été importés sous les alias pd et np.
Cet exercice fait partie du cours
Analyser des données d’enquête en Python
Instructions
- Filtrez le jeu de données pour ne conserver que les États présents dans
random_clusters. - Créez un diagramme circulaire de la colonne
sought_treatment.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Subset dataset to inlude only states in cluster_sample
cluster_sample = ____[mh_survey.US_state_live.____(____)]
# Create a pie chart of the sought_treament column
treatment_pie = cluster_sample.____.____(normalize=True)
treatment_pie.____.____()
plt.show()