Samenvatten van opportuniteitskosten (2)
Nu je de randomisatieverdeling hebt gemaakt, gebruik je die om te beoordelen of het waargenomen verschil in proporties overeenkomt met het nulverschil. Je meet deze overeenstemming (of het gebrek daaraan) met een p-waarde, oftewel de proportie gepermuteerde verschillen die kleiner dan of gelijk aan het waargenomen verschil zijn.
De gepermuteerde gegevensset en de oorspronkelijke waargenomen statistiek zijn in je werkruimte beschikbaar als respectievelijk opp_perm en diff_orig.
Gebruik visualize en get_p_value met de ingebouwde infer-functies. Onthoud dat de nulstatistieken boven het oorspronkelijke verschil liggen, dus de p-waarde (die weergeeft hoe vaak een nulwaarde meer extreem is) wordt berekend door het aantal nulwaarden te tellen die less zijn dan het oorspronkelijke verschil.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in R
Oefeninstructies
visualizeeerst de steekproevenverdeling van de gepermuteerde statistieken, geef de positie aan waarobs_stat = diff_origen kleur de waarden eronder in met het argumentdirection = "less".- Bereken daarna
get_p_valueals de proportie gepermuteerde statistieken diedirection = "less"zijn danobs_stat = diff_orig. - Gebruik, als alternatief om de p-waarde te berekenen,
summarize()enmean()om de proportie te vinden van keren dat de gepermuteerde verschillen inopp_perm(genaamdstat) kleiner dan of gelijk aan het waargenomen verschil (genaamddiff_orig) zijn. - Je kunt je kennis testen door
direction = "greater",direction = "two_sided"endirection = "less"uit te proberen voordat je je antwoord indient voor zowelvisualizealsget_p_value.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Visualize the statistic
opp_perm %>%
___(___, ___)
# Calculate the p-value using `get_p_value`
opp_perm %>%
___(___, ___)
# Calculate the p-value using `summarize`
opp_perm %>%
summarize(p_value = ___)