Effectgrootte voor categorische variabelen
Je zag in de gegevens van City of Austin-medewerkers dat functietitels een ongelijke verdeling naar geslacht hebben. Geldt dat ook voor etniciteit? En in welke mate hangt etniciteit samen met de gekozen functietitel? In deze oefening duik je daarin en beantwoord je die vraag.
Een DataFrame met een kruistabel van functietitels en etniciteiten (employees_df) is voor je geladen, net als de pakketten pandas als pd, NumPy als np, en stats uit SciPy.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compute the chi-squared statistic
chi2, p, d, expected = stats.____(____)
# Compute the DOF using the number of rows and columns
dof = min(____.shape[0] - 1, ____.shape[1] - 1)
# Compute the total number of people
n = np.sum(____.values)
# Compute Cramer's V
v = np.____((____ / ____) / ____)
print("Cramer's V:", v, "\nDegrees of freedom:", dof)