Intervalles de prédiction pour une réponse individuelle
En plus d’un intervalle pour la valeur attendue de la réponse, on souhaite souvent obtenir un intervalle pour les réponses individuelles réelles. La formulation de la prédiction est la même, mais les points prédits sont plus dispersés autour de la droite, ce qui conduit à un écart-type plus élevé.
Comme pour l’intervalle autour des valeurs moyennes attendues, l’intervalle pour les valeurs individuelles prédites est plus étroit au centre que sur les extrémités, car l’estimation de la droite de régression est plus stable au centre. Notez que les intervalles pour les réponses moyennes sont bien plus étroits que ceux pour les réponses individuelles.
Vous avez déjà vu tidy() pour extraire les informations au niveau des coefficients d’un modèle, et augment() pour les informations au niveau des observations. glance() complète ce trio en fournissant les informations au niveau du modèle.
La régression linéaire est fournie sous le nom model et les prédictions de l’exercice précédent sont dans predictions.
Cet exercice fait partie du cours
Inférence pour la régression linéaire en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
twins_sigma <- model %>%
# Get model-level information
___ %>%
# Pull out sigma
___
predictions %>%
# Calculate the std err of the predictions
mutate(std_err_of_predictions = ___)