Taille de l’échantillon et région critique
À partir des distributions de randomisation des petits et grands jeux de données, calculez différents seuils de significativité. Rappelez-vous que ce qui vous intéresse le plus est une grande différence positive des taux de promotion ; vous allez donc calculer les quantiles supérieurs 0,90, 0,95 et 0,99.
Une fonction permettant de calculer ces quantiles, calc_upper_quantiles(), est fournie dans le script.
Cet exercice fait partie du cours
Bases de l’inférence en R
Instructions
- Comme point de référence, exécutez l’appel à
calc_upper_quantiles()pour calculer les quantiles pertinents associés au jeu de données original de 1000 différences permutées,disc_perm. - Faites de même pour le petit jeu de données,
disc_perm_small… - et pour le grand jeu de données,
disc_perm_big.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
calc_upper_quantiles <- function(dataset) {
dataset %>%
summarize(
q.90 = quantile(stat, p = 0.90),
q.95 = quantile(stat, p = 0.95),
q.99 = quantile(stat, p = 0.99)
)
}
# Recall the quantiles associated with the original dataset
calc_upper_quantiles(disc_perm)
# Calculate the quantiles associated with the small dataset
___
# Calculate the quantiles associated with the big dataset
___