Densità della randomizzazione
Usare 100 ripetizioni ti permette di capire il meccanismo della permutazione. Tuttavia, 100 non bastano per osservare l’intero intervallo dei valori plausibili per le differenze nulle nelle proporzioni.
Ricorda le quattro fasi dell’inferenza. Sono le stesse quattro fasi che userai in tutti gli esercizi di inferenza in questo corso e nei futuri corsi di inferenza statistica. Usa i nomi delle funzioni per aiutarti a ripercorrere il processo di analisi.
specifyspecifica le variabili di risposta ed esplicativa.hypothesizedichiara l’ipotesi nulla.generategenera ri-campionamenti, permutazioni o simulazioni.calculatecalcola le statistiche riassuntive.
In questo esercizio, ripeterai il processo 1000 volte per avere un’idea della distribuzione completa delle differenze nulle nelle proporzioni.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Istruzioni dell'esercizio
I pacchetti dplyr, ggplot2, NHANES e infer sono già stati caricati per te.
- Genera 1000 differenze di proporzioni mescolando la variabile
HomeOwnusando la sintassi diinfer. Ricorda la sintassi diinfer:specifyche la relazione di interesse è traHomeOwneGendere che un successo in questo contesto è la proprietà della casa,success = "Own".hypothesizeche l’ipotesi nulla sia vera connull = "independence"(cioè genere e proprietà della casa non sono correlati).generate1000 permutazioni; impostarepsa 1000.calculatela statistica constat = "diff in props"e l’ordinec("male", "female").
- Esegui il codice del grafico di densità per creare una rappresentazione visiva smussata della distribuzione delle differenze. Che forma ha la curva?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Perform 1000 permutations
homeown_perm <- homes %>%
# Specify HomeOwn vs. Gender, with `"Own" as success
___(___ ~ ___, success = "___") %>%
# Use a null hypothesis of independence
___(___) %>%
# Generate 1000 repetitions (by permutation)
___(reps = ___, type = "permute") %>%
# Calculate the difference in proportions (male then female)
___(___, order = ___))
# Density plot of 1000 permuted differences in proportions
ggplot(homeown_perm, aes(x = stat)) +
geom_density()