Stichprobengröße für den kritischen Bereich
Nutze die Randomisierungsverteilungen mit den kleinen und großen Datensätzen, um verschiedene Schwellenwerte für die Signifikanz zu berechnen. Denk daran: Dich interessiert vor allem ein großer positiver Unterschied in den Beförderungsquoten, daher berechnest du die oberen Quantile von 0,90, 0,95 und 0,99.
Eine Funktion zum Berechnen dieser Quantile, calc_upper_quantiles(), ist im Skript angegeben.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in R
Anleitung zur Übung
- Führe als Referenz den Aufruf von
calc_upper_quantiles()aus, um die relevanten Quantile zu berechnen, die zum ursprünglichen Datensatz mit 1000 permutierten Unterschieden,disc_perm, gehören. - Mach dasselbe für den kleinen Datensatz,
disc_perm_small… - und für den großen Datensatz,
disc_perm_big.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
calc_upper_quantiles <- function(dataset) {
dataset %>%
summarize(
q.90 = quantile(stat, p = 0.90),
q.95 = quantile(stat, p = 0.95),
q.99 = quantile(stat, p = 0.99)
)
}
# Recall the quantiles associated with the original dataset
calc_upper_quantiles(disc_perm)
# Calculate the quantiles associated with the small dataset
___
# Calculate the quantiles associated with the big dataset
___