Dimensione del campione per la regione critica

Usando le distribuzioni di randomizzazione con gli insiemi di dati piccolo e grande, calcola diverse soglie di significatività. Ricorda: ti interessa soprattutto una grande differenza positiva nei tassi di promozione, quindi stai calcolando i quantili superiori di 0,90, 0,95 e 0,99.

Una funzione per calcolare questi quantili, calc_upper_quantiles(), è riportata nello script.

Questo esercizio fa parte del corso

Fondamenti di inferenza in R

Visualizza corso

Istruzioni dell'esercizio

Come riferimento, esegui la chiamata a calc_upper_quantiles() per calcolare i quantili rilevanti associati all'insieme di dati originale di 1000 differenze permutate, disc_perm.
Fai lo stesso per l'insieme di dati piccolo, disc_perm_small …
e per l'insieme di dati grande, disc_perm_big.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

calc_upper_quantiles <- function(dataset) {
  dataset %>% 
    summarize(
      q.90 = quantile(stat, p = 0.90),
      q.95 = quantile(stat, p = 0.95),
      q.99 = quantile(stat, p = 0.99)
    )
}

# Recall the quantiles associated with the original dataset
calc_upper_quantiles(disc_perm)

# Calculate the quantiles associated with the small dataset
___

# Calculate the quantiles associated with the big dataset
___

Modifica ed esegui il codice