Steekproefomvang voor kritieke regio
Gebruik de randomisatiedistributies met de kleine en grote gegevenssets om verschillende afkappunten voor significantie te berekenen. Onthoud dat je vooral geïnteresseerd bent in een groot positief verschil in promotiepercentages, dus je berekent de bovenste kwantielen van 0,90, 0,95 en 0,99.
Een functie om deze kwantielen te berekenen, calc_upper_quantiles(), staat in het script.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in R
Oefeninstructies
- Voer ter referentie de aanroep van
calc_upper_quantiles()uit om de relevante kwantielen te berekenen die horen bij de oorspronkelijke gegevensset van 1000 gepermuteerde verschillen,disc_perm. - Doe hetzelfde voor de kleine gegevensset,
disc_perm_small… - en voor de grote gegevensset,
disc_perm_big.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
calc_upper_quantiles <- function(dataset) {
dataset %>%
summarize(
q.90 = quantile(stat, p = 0.90),
q.95 = quantile(stat, p = 0.95),
q.99 = quantile(stat, p = 0.99)
)
}
# Recall the quantiles associated with the original dataset
calc_upper_quantiles(disc_perm)
# Calculate the quantiles associated with the small dataset
___
# Calculate the quantiles associated with the big dataset
___