Analyse par grappes (cluster sampling)

Vous et un groupe de psychologues souhaitez analyser la santé mentale des employés. Votre étude repose sur une enquête visant à mesurer les attitudes envers la santé mentale dans le secteur tech et à examiner la fréquence des troubles de santé mentale parmi les travailleurs de la tech.

Le jeu de données, mh_survey, inclut le gender de la personne répondante, l’État américain où elle vit, US_state_live, et le fait qu’elle ait cherché un traitement pour sa santé mentale via son employeur, sought_treatment.

Vous allez créer un diagramme circulaire pour analyser la probabilité qu’un·e travailleur·se de la tech aux États-Unis cherche un traitement pour sa santé mentale, sought_treatment. Une liste aléatoire de 10 grappes d’États, random_cluster, a été téléchargée pour vous.

Pandas et numpy ont été importés sous les alias pd et np.

Cet exercice fait partie du cours

Analyser des données d’enquête en Python

Afficher le cours

Instructions

Filtrez le jeu de données pour ne conserver que les États présents dans random_clusters.
Créez un diagramme circulaire de la colonne sought_treatment.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Subset dataset to inlude only states in cluster_sample
cluster_sample = ____[mh_survey.US_state_live.____(____)]

# Create a pie chart of the sought_treament column
treatment_pie = cluster_sample.____.____(normalize=True)
treatment_pie.____.____()
plt.show()

Modifier et exécuter le code

Cet exercice fait partie du cours

Analyser des données d’enquête en Python

IntermédiaireNiveau de compétence

4.7+

Commencer le cours gratuitement

Qu’est-ce qu’une donnée d’enquête et comment choisir le test statistique adapté pour l’analyser ? Pour y répondre, vous serez en mesure de définir différents types de données d’enquête, d’aborder des notions clés comme les statistiques descriptives et inférentielles, et de visualiser des données d’enquête pour déterminer la technique de modélisation statistique appropriée. Ainsi, vous saurez comment qualifier au mieux, qualitativement et quantitativement, les tendances et enseignements mis en évidence par les enquêtes.

Exercise 1: Introduction à l’analyse des données d’enquête Exercise 2: Examiner les niveaux de mesure Exercise 3: Table de contingence Exercise 4: Statistiques descriptives et inférentielles Exercise 5: Statistiques descriptives Exercise 6: Statistiques inférentielles Exercise 7: Techniques de modélisation statistique Exercise 8: Inspection d’un nuage de points Exercise 9: Choisir une méthode statistique Exercise 10: Faire correspondre la technique d’échantillonnage

Dans ce chapitre, vous apprendrez différentes façons de constituer un échantillon d’enquête à partir d’une population, en analysant les paramètres selon lesquels l’enquête a été réalisée.

Exercise 1: Échantillonnage aléatoire Exercise 2: Échantillon aléatoire d’employés Exercise 3: Échantillonnage aléatoire reproductible Exercise 4: Échantillonnage aléatoire stratifié Exercise 5: Répartition des « oui » et des « non »Exercise 6: Échantillonnage stratifié Exercise 7: Échantillonnage pondéré Exercise 8: Sondage du blog Exercise 9: Échantillonnage pondéré sur la latéralité Exercise 10: Échantillonnage en grappes Exercise 11: Regrouper les grappes Exercise 12: Choisir des grappes Exercise 13: Analyse par grappes (cluster sampling)

Exercice en cours

Il est temps de comprendre la différence entre statistiques descriptives et inférentielles dans l’analyse d’enquêtes, à l’aide d’exemples concrets. Grâce à des exercices pratiques, vous approfondirez l’interprétation de différentes variables, des mesures clés comme la tendance centrale et le z-score, et vous saurez interpréter les résultats pour passer à l’action.

Exercise 1: Statistiques descriptives dans l’analyse d’enquêtes Exercise 2: Distribution des fréquences Exercise 3: Mesures de variabilité Exercise 4: Mesures de tendance centrale Exercise 5: Statistiques inférentielles dans l’analyse d’enquêtes Exercise 6: Visualiser les données : histogramme Exercise 7: Trouver le z-score Exercise 8: Corrélations Exercise 9: Analyser des variables avec .corr()Exercise 10: Les employés sont-ils satisfaits ?Exercise 11: À la régulière

Pour finir, vous appliquerez la modélisation statistique à l’analyse d’enquêtes avec l’analyse de régression, le test t à deux échantillons, le test du khi carré, et vous interpréterez les hypothèses associées à ces tests.

Exercise 1: Analyse de régression Exercise 2: Ajuster un modèle de régression linéaire Exercise 3: Visualiser des données d’enquête Exercise 4: Des précautions de sécurité nécessaires ?Exercise 5: Test t à deux échantillons Exercise 6: Les femmes sont-elles plus extraverties ?Exercise 7: Test t à deux échantillons sur l’extraversion Exercise 8: Test du chi carré Exercise 9: Chi carré ou pas chi carré ?Exercise 10: Enquête sur la santé mentale dans la tech Exercise 11: Santé mentale vs. travail à distance Exercise 12: Félicitations