Inférence avec et sans valeur aberrante (randomisation)
À l’aide du test par randomisation, vous pouvez à nouveau évaluer l’effet d’une valeur aberrante sur les conclusions inférentielles d’un modèle linéaire. Exécutez un test par randomisation sur les données hypdata_out deux fois : une fois avec la valeur aberrante et une fois sans. Notez que les lignes de code détaillées décrivent clairement les étapes des tests par randomisation.
Cet exercice fait partie du cours
Inférence pour la régression linéaire en R
Instructions
À partir des data frames hypdata_out (contenant une valeur aberrante) et hypdata_noout (valeur aberrante retirée), les data frames perm_slope_out et perm_slope_noout ont été créés pour contenir respectivement les pentes permutées des jeux de données d’origine. Les valeurs observées sont stockées dans les variables obs_slope_out et obs_slope_noout.
- Trouvez les valeurs p en calculant la proportion de pentes permutées dont la valeur (
absolue) est supérieure ou égale à la valeur (absolue) des pentes observées. Comme précédemment, utilisezmeansur l’inégalité binaire pour obtenir la proportion.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the p-value with the outlier
perm_slope_out %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)
# Calculate the p-value without the outlier
perm_slope_noout %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)