Intervalles de prédiction pour une réponse individuelle

En plus d’un intervalle pour la valeur attendue de la réponse, on souhaite souvent obtenir un intervalle pour les réponses individuelles réelles. La formulation de la prédiction est la même, mais les points prédits sont plus dispersés autour de la droite, ce qui conduit à un écart-type plus élevé.

Comme pour l’intervalle autour des valeurs moyennes attendues, l’intervalle pour les valeurs individuelles prédites est plus étroit au centre que sur les extrémités, car l’estimation de la droite de régression est plus stable au centre. Notez que les intervalles pour les réponses moyennes sont bien plus étroits que ceux pour les réponses individuelles.

Vous avez déjà vu tidy() pour extraire les informations au niveau des coefficients d’un modèle, et augment() pour les informations au niveau des observations. glance() complète ce trio en fournissant les informations au niveau du modèle.

La régression linéaire est fournie sous le nom model et les prédictions de l’exercice précédent sont dans predictions.

Cet exercice fait partie du cours

Inférence pour la régression linéaire en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

twins_sigma <- model %>%
  # Get model-level information
  ___ %>%
  # Pull out sigma
  ___

predictions %>%
  # Calculate the std err of the predictions
  mutate(std_err_of_predictions = ___)

Modifier et exécuter le code