p-Werte berechnen
Im Video hast du gelernt, dass ein p-Wert den Grad der Abweichung zwischen den Daten und der Nullhypothese misst. Hier berechnest du den p-Wert für den ursprünglichen Diskriminierungs-Datensatz sowie für die kleine und große Version, disc_small und disc_big.
Die ursprünglichen Differenzen der Anteile stehen dir in deinem Workspace zur Verfügung: diff_orig, diff_orig_small und diff_orig_big. Ebenso die permutierten Datensätze: disc_perm, disc_perm_small und disc_perm_big.
Denk daran, dass dich hier nur der einseitige Hypothesentest interessiert. Du beantwortest also die Frage: „Werden Männer mit höherer Wahrscheinlichkeit befördert als Frauen?“
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in R
Anleitung zur Übung
- Verwende
visualize()undget_p_value()mit den integrierteninfer-Funktionen. Denk daran: Die Nullstatistiken liegen unterhalb der ursprünglichen Differenz. Daher wird der p-Wert (der angibt, wie oft ein Nullwert noch „extremer“ ist) berechnet, indem gezählt wird, wie viele Nullwertegreaterals die ursprüngliche Differenz sind. - Wiederhole das für den kleinen Datensatz
disc_perm_smallmit der beobachteten Differenzdiff_orig_small. - Wiederhole das für den großen Datensatz
disc_perm_bigmit der beobachteten Differenzdiff_orig_big. - Du kannst dein Verständnis überprüfen, indem du vor dem Absenden deiner Antwort Folgendes ausprobierst:
direction = "greater",direction = "two_sided"unddirection = "less".
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Visualize and calculate the p-value for the original dataset
disc_perm %>%
___(obs_stat = ___, direction = "___")
disc_perm %>%
___(___, ___)
# Visualize and calculate the p-value for the small dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)
# Visualize and calculate the p-value for the big dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)