De p-waarden berekenen
In de video heb je geleerd dat een p-waarde aangeeft in welke mate de data in tegenspraak is met de nulhypothese. Hier ga je de p-waarde berekenen voor de oorspronkelijke discriminatiegegevensset en voor de kleine en grote versies, disc_small en disc_big.
De oorspronkelijke verschillen in proporties staan al klaar in je werkruimte: diff_orig, diff_orig_small en diff_orig_big. De permutatiegegevenssets disc_perm, disc_perm_small en disc_perm_big zijn ook beschikbaar.
Onthoud dat je hier alleen geïnteresseerd bent in een eenzijdige hypothesetoets. Je wilt dus de vraag beantwoorden: "Worden mannen vaker gepromoveerd dan vrouwen?"
Deze oefening maakt deel uit van de cursus
Basis van inferentie in R
Oefeninstructies
- Gebruik
visualize()enget_p_value()met de ingebouwdeinfer-functies. Onthoud dat de nulstatistieken onder het oorspronkelijke verschil liggen, dus de p-waarde (die aangeeft hoe vaak een nulwaarde extremer is) bereken je door te tellen hoeveel nulwaardengreaterzijn dan het oorspronkelijke verschil. - Herhaal dit voor de kleine gegevensset,
disc_perm_small, met het geobserveerde verschildiff_orig_small. - Herhaal dit voor de grote gegevensset,
disc_perm_big, met het geobserveerde verschildiff_orig_big. - Test je kennis door te proberen:
direction = "greater",direction = "two_sided"endirection = "less"voordat je je antwoord indient.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Visualize and calculate the p-value for the original dataset
disc_perm %>%
___(obs_stat = ___, direction = "___")
disc_perm %>%
___(___, ___)
# Visualize and calculate the p-value for the small dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)
# Visualize and calculate the p-value for the big dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)