Gerandomiseerde statistieken en dotplot
Door de variabele voor huiseigendom meerdere keren te permuteren, genereer je verschillen in proporties die passen bij de aanname dat de variabelen niet gerelateerd zijn. De statistiek van interesse is het verschil in proporties, aangegeven met stat = "diff in props". Nadat je de gerandomiseerde statistieken hebt berekend, plot je ze in een dotplot.
Deze oefening laat alle vier de stappen uit het infer-pakket zien:
specifyspecificeert de respons- en verklarende variabelen.hypothesizegeeft de nulhypothese aan.generatemaakt steekproeven, permutaties of simulaties.calculateberekent samenvattende statistieken.
Elke stap komt aan bod in de cursus; in deze oefening schrijf je code voor calculate().
De pakketten dplyr, ggplot2, NHANES en infer zijn al voor je geladen. Herhaal het permuteren en plotten met 100 verschillen in proporties die zijn gegenereerd door de variabele HomeOwn te shufflen.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Perform 100 permutations
homeown_perm <- homes %>%
specify(HomeOwn ~ Gender, success = "Own") %>%
hypothesize(null = "independence") %>%
generate(reps = 100, type = "permute") %>%
___(___, order = ___)
# Print results to console
homeown_perm