Zusammenfassung der Opportunitätskosten (2)
Jetzt, da du die Randomisierungsverteilung erstellt hast, verwendest du sie, um zu prüfen, ob die beobachtete Differenz der Anteile mit der Null-Differenz vereinbar ist. Du misst diese Übereinstimmung (oder ihr Ausbleiben) mit einem p-Wert, also dem Anteil der permutierten Differenzen, die kleiner oder gleich der beobachteten Differenz sind.
Der permutierte Datensatz und die ursprünglich beobachtete Statistik sind in deinem Arbeitsbereich als opp_perm bzw. diff_orig verfügbar.
Verwende visualize und get_p_value mit den eingebauten infer-Funktionen. Denk daran: Die Null-Statistiken liegen über der ursprünglichen Differenz, daher wird der p-Wert (der angibt, wie oft ein Nullwert noch extremer ist) berechnet, indem du die Anzahl der Nullwerte zählst, die less als die ursprüngliche Differenz sind.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in R
Anleitung zur Übung
- Visualisiere zuerst die Stichprobenverteilung der permutierten Statistiken, markiere die Stelle, an der
obs_stat = diff_origliegt, und färbe die Werte darunter mitdirection = "less"ein. - Anschließend wird
get_p_valueals der Anteil der permutierten Statistiken berechnet, diedirection = "less"sind alsobs_stat = diff_orig. - Als alternative Methode zur Berechnung des p-Werts kannst du mit
summarize()undmean()den Anteil der Fälle bestimmen, in denen die permutierten Differenzen inopp_perm(genanntstat) kleiner oder gleich der beobachteten Differenz (genanntdiff_orig) sind. - Du kannst dein Wissen testen, indem du vor dem Absenden deiner Antwort sowohl bei
visualizeals auch beiget_p_valuemitdirection = "greater",direction = "two_sided"unddirection = "less"experimentierst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Visualize the statistic
opp_perm %>%
___(___, ___)
# Calculate the p-value using `get_p_value`
opp_perm %>%
___(___, ___)
# Calculate the p-value using `summarize`
opp_perm %>%
summarize(p_value = ___)