De p-waarden berekenen

In de video heb je geleerd dat een p-waarde aangeeft in welke mate de data in tegenspraak is met de nulhypothese. Hier ga je de p-waarde berekenen voor de oorspronkelijke discriminatiegegevensset en voor de kleine en grote versies, disc_small en disc_big.

De oorspronkelijke verschillen in proporties staan al klaar in je werkruimte: diff_orig, diff_orig_small en diff_orig_big. De permutatiegegevenssets disc_perm, disc_perm_small en disc_perm_big zijn ook beschikbaar.

Onthoud dat je hier alleen geïnteresseerd bent in een eenzijdige hypothesetoets. Je wilt dus de vraag beantwoorden: "Worden mannen vaker gepromoveerd dan vrouwen?"

Deze oefening maakt deel uit van de cursus

Basis van inferentie in R

Bekijk cursus

Oefeninstructies

Gebruik visualize() en get_p_value() met de ingebouwde infer-functies. Onthoud dat de nulstatistieken onder het oorspronkelijke verschil liggen, dus de p-waarde (die aangeeft hoe vaak een nulwaarde extremer is) bereken je door te tellen hoeveel nulwaarden greater zijn dan het oorspronkelijke verschil.
Herhaal dit voor de kleine gegevensset, disc_perm_small, met het geobserveerde verschil diff_orig_small.
Herhaal dit voor de grote gegevensset, disc_perm_big, met het geobserveerde verschil diff_orig_big.
Test je kennis door te proberen: direction = "greater", direction = "two_sided" en direction = "less" voordat je je antwoord indient.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Visualize and calculate the p-value for the original dataset
disc_perm %>%
  ___(obs_stat = ___, direction = "___")

disc_perm %>%
  ___(___, ___)

# Visualize and calculate the p-value for the small dataset
___ %>%
  ___(___, ___)

___ %>%
  ___(___, ___)

# Visualize and calculate the p-value for the big dataset
___ %>%
  ___(___, ___)

___ %>%
  ___(___, ___)

Code bewerken en uitvoeren