Steekproefomvang voor kritieke regio

Gebruik de randomisatiedistributies met de kleine en grote gegevenssets om verschillende afkappunten voor significantie te berekenen. Onthoud dat je vooral geïnteresseerd bent in een groot positief verschil in promotiepercentages, dus je berekent de bovenste kwantielen van 0,90, 0,95 en 0,99.

Een functie om deze kwantielen te berekenen, calc_upper_quantiles(), staat in het script.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in R

Bekijk cursus

Oefeninstructies

Voer ter referentie de aanroep van calc_upper_quantiles() uit om de relevante kwantielen te berekenen die horen bij de oorspronkelijke gegevensset van 1000 gepermuteerde verschillen, disc_perm.
Doe hetzelfde voor de kleine gegevensset, disc_perm_small …
en voor de grote gegevensset, disc_perm_big.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

calc_upper_quantiles <- function(dataset) {
  dataset %>% 
    summarize(
      q.90 = quantile(stat, p = 0.90),
      q.95 = quantile(stat, p = 0.95),
      q.99 = quantile(stat, p = 0.99)
    )
}

# Recall the quantiles associated with the original dataset
calc_upper_quantiles(disc_perm)

# Calculate the quantiles associated with the small dataset
___

# Calculate the quantiles associated with the big dataset
___

Code bewerken en uitvoeren