Aan de slagGa gratis aan de slag

Gerandomiseerde statistieken en dotplot

Door de variabele voor huiseigendom meerdere keren te permuteren, genereer je verschillen in proporties die passen bij de aanname dat de variabelen niet gerelateerd zijn. De statistiek van interesse is het verschil in proporties, aangegeven met stat = "diff in props". Nadat je de gerandomiseerde statistieken hebt berekend, plot je ze in een dotplot.

Deze oefening laat alle vier de stappen uit het infer-pakket zien:

  • specify specificeert de respons- en verklarende variabelen.
  • hypothesize geeft de nulhypothese aan.
  • generate maakt steekproeven, permutaties of simulaties.
  • calculate berekent samenvattende statistieken.

Elke stap komt aan bod in de cursus; in deze oefening schrijf je code voor calculate().

De pakketten dplyr, ggplot2, NHANES en infer zijn al voor je geladen. Herhaal het permuteren en plotten met 100 verschillen in proporties die zijn gegenereerd door de variabele HomeOwn te shufflen.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Perform 100 permutations
homeown_perm <- homes %>%
  specify(HomeOwn ~ Gender, success = "Own") %>%
  hypothesize(null = "independence") %>% 
  generate(reps = 100, type = "permute") %>% 
  ___(___, order = ___)
  
# Print results to console
homeown_perm
Code bewerken en uitvoeren