CommencerCommencez gratuitement

Analyse par grappes (cluster sampling)

Vous et un groupe de psychologues souhaitez analyser la santé mentale des employés. Votre étude repose sur une enquête visant à mesurer les attitudes envers la santé mentale dans le secteur tech et à examiner la fréquence des troubles de santé mentale parmi les travailleurs de la tech.

Le jeu de données, mh_survey, inclut le gender de la personne répondante, l’État américain où elle vit, US_state_live, et le fait qu’elle ait cherché un traitement pour sa santé mentale via son employeur, sought_treatment.

Vous allez créer un diagramme circulaire pour analyser la probabilité qu’un·e travailleur·se de la tech aux États-Unis cherche un traitement pour sa santé mentale, sought_treatment. Une liste aléatoire de 10 grappes d’États, random_cluster, a été téléchargée pour vous.

Pandas et numpy ont été importés sous les alias pd et np.

Cet exercice fait partie du cours

<cours>Analyser des données d’enquête en Python</cours>
Voir le cours

Instructions de l’exercice

  • Filtrez le jeu de données pour ne conserver que les États présents dans random_clusters.
  • Créez un diagramme circulaire de la colonne sought_treatment.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Subset dataset to inlude only states in cluster_sample
cluster_sample = ____[mh_survey.US_state_live.____(____)]

# Create a pie chart of the sought_treament column
treatment_pie = cluster_sample.____.____(normalize=True)
treatment_pie.____.____()
plt.show()
Modifier et exécuter le code