CommencerCommencer gratuitement

Taille d’effet pour des variables catégorielles

Vous avez vu dans les données des employés de la ville d’Austin que les intitulés de poste présentent une répartition inégale selon le genre. Mais observe-t-on la même chose pour les origines ethniques ? Et dans quelle mesure l’ethnie est-elle liée à l’intitulé de poste ? Dans cet exercice, vous allez creuser la question et y répondre.

Un DataFrame comparant intitulés de poste et origines ethniques (employees_df) a été chargé pour vous, ainsi que les packages pandas sous pd, NumPy sous np, et stats de SciPy.

Cet exercice fait partie du cours

Fondements de l’inférence en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute the chi-squared statistic
chi2, p, d, expected = stats.____(____)

# Compute the DOF using the number of rows and columns
dof = min(____.shape[0] - 1, ____.shape[1] - 1)

# Compute the total number of people
n = np.sum(____.values)

# Compute Cramer's V
v = np.____((____ / ____) / ____)

print("Cramer's V:", v, "\nDegrees of freedom:", dof)
Modifier et exécuter le code