CommencerCommencer gratuitement

Analyse par grappes (cluster sampling)

Vous et un groupe de psychologues souhaitez analyser la santé mentale des employés. Votre étude repose sur une enquête visant à mesurer les attitudes envers la santé mentale dans le secteur tech et à examiner la fréquence des troubles de santé mentale parmi les travailleurs de la tech.

Le jeu de données, mh_survey, inclut le gender de la personne répondante, l’État américain où elle vit, US_state_live, et le fait qu’elle ait cherché un traitement pour sa santé mentale via son employeur, sought_treatment.

Vous allez créer un diagramme circulaire pour analyser la probabilité qu’un·e travailleur·se de la tech aux États-Unis cherche un traitement pour sa santé mentale, sought_treatment. Une liste aléatoire de 10 grappes d’États, random_cluster, a été téléchargée pour vous.

Pandas et numpy ont été importés sous les alias pd et np.

Cet exercice fait partie du cours

Analyser des données d’enquête en Python

Afficher le cours

Instructions

  • Filtrez le jeu de données pour ne conserver que les États présents dans random_clusters.
  • Créez un diagramme circulaire de la colonne sought_treatment.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Subset dataset to inlude only states in cluster_sample
cluster_sample = ____[mh_survey.US_state_live.____(____)]

# Create a pie chart of the sought_treament column
treatment_pie = cluster_sample.____.____(normalize=True)
treatment_pie.____.____()
plt.show()
Modifier et exécuter le code