Quando l’ipotesi nulla è vera: decisione
Nell’ultimo esercizio, la differenza osservata tra proporzioni si trovava comodamente al centro della distribuzione nulla. In questo esercizio prenderai una decisione formale sul rifiuto o meno dell’ipotesi nulla, ma invece di usare i valori p userai il concetto di regione di rifiuto.
La regione di rifiuto è l’intervallo di valori della statistica che ti porta a rifiutare l’ipotesi nulla. In un test a due code ci sono due regioni di rifiuto. Sai che la regione superiore deve contenere il 2,5% più alto delle statistiche nulle (quando alpha = .05), quindi puoi estrarre il valore soglia trovando il quantile .975 con quantile(). Allo stesso modo, la regione inferiore contiene il 2,5% più basso delle statistiche nulle, che si può trovare sempre con quantile().
Ecco un rapido esempio di come funziona la funzione quantile() su questo semplice insieme di dati x.
x <- c(0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20)
quantile(x, probs = .5)
quantile(x, probs = .8)
Una volta definita la regione di rifiuto tramite le soglie superiore e inferiore, puoi decidere riguardo all’ipotesi nulla verificando se la statistica osservata cade tra queste soglie (in tal caso non rifiuterai) oppure al di fuori (in tal caso rifiuterai).
Questo esercizio fa parte del corso
Inferenza per dati categorici in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Set alpha
___
# Find cutoffs
lower <- null %>%
summarize(l = quantile(___, probs = ___)) %>%
pull()
upper <- null %>%
summarize(u = quantile(___, probs = ___)) %>%
pull()
# Is d_hat inside cutoffs?
d_hat %>%
between(___, ___)