Aan de slagGa gratis aan de slag

Effectgrootte voor categorische variabelen

Je zag in de gegevens van City of Austin-medewerkers dat functietitels een ongelijke verdeling naar geslacht hebben. Geldt dat ook voor etniciteit? En in welke mate hangt etniciteit samen met de gekozen functietitel? In deze oefening duik je daarin en beantwoord je die vraag.

Een DataFrame met een kruistabel van functietitels en etniciteiten (employees_df) is voor je geladen, net als de pakketten pandas als pd, NumPy als np, en stats uit SciPy.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Compute the chi-squared statistic
chi2, p, d, expected = stats.____(____)

# Compute the DOF using the number of rows and columns
dof = min(____.shape[0] - 1, ____.shape[1] - 1)

# Compute the total number of people
n = np.sum(____.values)

# Compute Cramer's V
v = np.____((____ / ____) / ____)

print("Cramer's V:", v, "\nDegrees of freedom:", dof)
Code bewerken en uitvoeren