Effektstärke für kategoriale Variablen
Du hast in den Mitarbeiterdaten der Stadt Austin gesehen, dass Berufsbezeichnungen ungleich nach Geschlechtern verteilt sind. Gilt das auch für Ethnien? Und in welchem Ausmaß hängt die Ethnie mit der gewählten Berufsbezeichnung zusammen? In dieser Übung gehst du dem nach und beantwortest diese Frage.
Ein DataFrame zum Vergleich von Berufsbezeichnungen und Ethnien (employees_df) wurde für dich geladen, ebenso die Pakete pandas als pd, NumPy als np und stats aus SciPy.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Compute the chi-squared statistic
chi2, p, d, expected = stats.____(____)
# Compute the DOF using the number of rows and columns
dof = min(____.shape[0] - 1, ____.shape[1] - 1)
# Compute the total number of people
n = np.sum(____.values)
# Compute Cramer's V
v = np.____((____ / ____) / ____)
print("Cramer's V:", v, "\nDegrees of freedom:", dof)