Calcul des p-values
Dans la vidéo, vous avez appris qu'une p-value mesure le degré de désaccord entre les données et l'hypothèse nulle. Ici, vous allez calculer la p-value pour le jeu de données original sur la discrimination ainsi que pour ses versions réduite et étendue, disc_small et disc_big.
Les différences de proportions observées sont disponibles dans votre espace de travail : diff_orig, diff_orig_small et diff_orig_big, de même que les jeux de données permutés : disc_perm, disc_perm_small et disc_perm_big.
Rappelez-vous que vous vous intéressez ici à un test unilatéral. Autrement dit, vous cherchez à répondre à la question : « Les hommes ont-ils plus de chances d’être promus que les femmes ?»
Cet exercice fait partie du cours
Bases de l’inférence en R
Instructions
- Utilisez
visualize()etget_p_value()grâce aux fonctions intégrées deinfer. Rappelez-vous que les statistiques sous l'hypothèse nulle se situent en dessous de la différence observée, donc la p-value (qui représente la fréquence à laquelle une valeur nulle est plus « extrême ») se calcule en comptant le nombre de valeurs nulles qui sontgreaterque la différence observée. - Répétez pour le petit jeu de données,
disc_perm_small, qui a pour différence observéediff_orig_small. - Répétez pour le grand jeu de données,
disc_perm_big, qui a pour différence observéediff_orig_big. - Vous pouvez vérifier votre compréhension en essayant :
direction = "greater",direction = "two_sided"etdirection = "less"avant de Soumettre la réponse.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Visualize and calculate the p-value for the original dataset
disc_perm %>%
___(obs_stat = ___, direction = "___")
disc_perm %>%
___(___, ___)
# Visualize and calculate the p-value for the small dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)
# Visualize and calculate the p-value for the big dataset
___ %>%
___(___, ___)
___ %>%
___(___, ___)