Dimensione del campione per la regione critica
Usando le distribuzioni di randomizzazione con gli insiemi di dati piccolo e grande, calcola diverse soglie di significatività. Ricorda: ti interessa soprattutto una grande differenza positiva nei tassi di promozione, quindi stai calcolando i quantili superiori di 0,90, 0,95 e 0,99.
Una funzione per calcolare questi quantili, calc_upper_quantiles(), è riportata nello script.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Istruzioni dell'esercizio
- Come riferimento, esegui la chiamata a
calc_upper_quantiles()per calcolare i quantili rilevanti associati all'insieme di dati originale di 1000 differenze permutate,disc_perm. - Fai lo stesso per l'insieme di dati piccolo,
disc_perm_small… - e per l'insieme di dati grande,
disc_perm_big.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
calc_upper_quantiles <- function(dataset) {
dataset %>%
summarize(
q.90 = quantile(stat, p = 0.90),
q.95 = quantile(stat, p = 0.95),
q.99 = quantile(stat, p = 0.99)
)
}
# Recall the quantiles associated with the original dataset
calc_upper_quantiles(disc_perm)
# Calculate the quantiles associated with the small dataset
___
# Calculate the quantiles associated with the big dataset
___