Statistiche randomizzate e dotplot
Permutando più volte la variabile sul possesso della casa, generi differenze nelle proporzioni coerenti con l'assunzione che le variabili non siano correlate. La statistica di interesse è la differenza nelle proporzioni, indicata da stat = "diff in props". Dopo aver calcolato le statistiche randomizzate, le visualizzerai in un dotplot.
Questo esercizio mostra tutti e quattro i passaggi del pacchetto infer:
specifyspecifica le variabili di risposta ed esplicativa.hypothesizedichiara l'ipotesi nulla.generategenera ri-campionamenti, permutazioni o simulazioni.calculatecalcola le statistiche di sintesi.
Ogni passaggio verrà approfondito nel corso; in questo esercizio scriverai il codice per calculate().
I pacchetti dplyr, ggplot2, NHANES e infer sono già stati caricati per te. Ripeti la permutazione e il grafico con 100 differenze nelle proporzioni generate rimescolando la variabile HomeOwn.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Perform 100 permutations
homeown_perm <- homes %>%
specify(HomeOwn ~ Gender, success = "Own") %>%
hypothesize(null = "independence") %>%
generate(reps = 100, type = "permute") %>%
___(___, order = ___)
# Print results to console
homeown_perm