CommencerCommencer gratuitement

Taille de l’échantillon et région critique

À partir des distributions de randomisation des petits et grands jeux de données, calculez différents seuils de significativité. Rappelez-vous que ce qui vous intéresse le plus est une grande différence positive des taux de promotion ; vous allez donc calculer les quantiles supérieurs 0,90, 0,95 et 0,99.

Une fonction permettant de calculer ces quantiles, calc_upper_quantiles(), est fournie dans le script.

Cet exercice fait partie du cours

Bases de l’inférence en R

Afficher le cours

Instructions

  • Comme point de référence, exécutez l’appel à calc_upper_quantiles() pour calculer les quantiles pertinents associés au jeu de données original de 1000 différences permutées, disc_perm.
  • Faites de même pour le petit jeu de données, disc_perm_small
  • et pour le grand jeu de données, disc_perm_big.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

calc_upper_quantiles <- function(dataset) {
  dataset %>% 
    summarize(
      q.90 = quantile(stat, p = 0.90),
      q.95 = quantile(stat, p = 0.95),
      q.99 = quantile(stat, p = 0.99)
    )
}

# Recall the quantiles associated with the original dataset
calc_upper_quantiles(disc_perm)

# Calculate the quantiles associated with the small dataset
___

# Calculate the quantiles associated with the big dataset
___
Modifier et exécuter le code