CommencerCommencez gratuitement

Taille d’effet pour des variables catégorielles

Vous avez vu dans les données des employés de la ville d’Austin que les intitulés de poste présentent une répartition inégale selon le genre. Mais observe-t-on la même chose pour les origines ethniques ? Et dans quelle mesure l’ethnie est-elle liée à l’intitulé de poste ? Dans cet exercice, vous allez creuser la question et y répondre.

Un DataFrame comparant intitulés de poste et origines ethniques (employees_df) a été chargé pour vous, ainsi que les packages pandas sous pd, NumPy sous np, et stats de SciPy.

Cet exercice fait partie du cours

<cours>Fondements de l’inférence en Python</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Compute the chi-squared statistic
chi2, p, d, expected = stats.____(____)

# Compute the DOF using the number of rows and columns
dof = min(____.shape[0] - 1, ____.shape[1] - 1)

# Compute the total number of people
n = np.sum(____.values)

# Compute Cramer's V
v = np.____((____ / ____) / ____)

print("Cramer's V:", v, "\nDegrees of freedom:", dof)
Modifier et exécuter le code