CommencerCommencer gratuitement

Résumer le coût d’opportunité (2)

Maintenant que vous avez créé la distribution par randomisation, vous allez l’utiliser pour évaluer si la différence observée de proportions est compatible avec l’hypothèse nulle (différence nulle). Vous mesurerez cette compatibilité (ou son absence) avec une valeur p, c’est-à-dire la proportion de différences permutées inférieures ou égales à la différence observée.

Le jeu de données permuté et la statistique observée initiale sont disponibles dans votre espace de travail sous les noms opp_perm et diff_orig respectivement.

Utilisez visualize et get_p_value avec les fonctions intégrées de infer. Rappelez-vous que les statistiques sous l’hypothèse nulle se trouvent au-dessus de la différence observée, donc la valeur p (qui représente la fréquence à laquelle une valeur nulle est plus « extrême ») se calcule en comptant le nombre de valeurs nulles qui sont less que la différence observée.

Cet exercice fait partie du cours

Bases de l’inférence en R

Afficher le cours

Instructions

  • Commencez par visualize la distribution d’échantillonnage des statistiques permutées en indiquant l’emplacement où obs_stat = diff_orig, et en coloriant les valeurs en dessous avec l’argument direction = "less".
  • Ensuite, get_p_value se calcule comme la proportion de statistiques permutées qui sont direction = "less" que obs_stat = diff_orig.
  • En alternative pour calculer la valeur p, utilisez summarize() et mean() pour obtenir la proportion de fois où les différences permutées dans opp_perm (appelées stat) sont inférieures ou égales à la différence observée (appelée diff_orig).
  • Vous pouvez tester vos connaissances en essayant : direction = "greater", direction = "two_sided", et direction = "less" avant de Soumettre votre réponse pour visualize et get_p_value.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Visualize the statistic 
opp_perm %>%
  ___(___, ___)

# Calculate the p-value using `get_p_value`
opp_perm %>%
  ___(___, ___)

# Calculate the p-value using `summarize`
opp_perm %>%
  summarize(p_value = ___)
Modifier et exécuter le code