Zusammenfassung der Opportunitätskosten (2)
Jetzt, da du die Randomisierungsverteilung erstellt hast, verwendest du sie, um zu prüfen, ob die beobachtete Differenz der Anteile mit der Null-Differenz vereinbar ist. Du misst diese Übereinstimmung (oder ihr Ausbleiben) mit einem p-Wert, also dem Anteil der permutierten Differenzen, die kleiner oder gleich der beobachteten Differenz sind.
Der permutierte Datensatz und die ursprünglich beobachtete Statistik sind in deinem Arbeitsbereich als opp_perm bzw. diff_orig verfügbar.
Verwende visualize und get_p_value mit den eingebauten infer-Funktionen. Denk daran: Die Null-Statistiken liegen über der ursprünglichen Differenz, daher wird der p-Wert (der angibt, wie oft ein Nullwert noch extremer ist) berechnet, indem du die Anzahl der Nullwerte zählst, die less als die ursprüngliche Differenz sind.
Diese Übung ist Teil des Kurses
<Kurs>Grundlagen der Inferenz in R</Kurs>Übungsanweisungen
- Visualisiere zuerst die Stichprobenverteilung der permutierten Statistiken, markiere die Stelle, an der
obs_stat = diff_origliegt, und färbe die Werte darunter mitdirection = "less"ein. - Anschließend wird
get_p_valueals der Anteil der permutierten Statistiken berechnet, diedirection = "less"sind alsobs_stat = diff_orig. - Als alternative Methode zur Berechnung des p-Werts kannst du mit
summarize()undmean()den Anteil der Fälle bestimmen, in denen die permutierten Differenzen inopp_perm(genanntstat) kleiner oder gleich der beobachteten Differenz (genanntdiff_orig) sind. - Du kannst dein Wissen testen, indem du vor dem Absenden deiner Antwort sowohl bei
visualizeals auch beiget_p_valuemitdirection = "greater",direction = "two_sided"unddirection = "less"experimentierst.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Visualize the statistic
opp_perm %>%
___(___, ___)
# Calculate the p-value using `get_p_value`
opp_perm %>%
___(___, ___)
# Calculate the p-value using `summarize`
opp_perm %>%
summarize(p_value = ___)