Prognoseintervalle für einzelne Antworten

Zusätzlich zu einem Intervallschätzer für den erwarteten Wert der Antwort ist oft auch ein Intervallschätzer für die tatsächlichen individuellen Antworten gefragt. Die Formulierung für die Prognose ist dieselbe, aber die vorhergesagten Punkte streuen stärker um die Linie, daher wird der Standardfehler größer berechnet.

Wie beim Intervall um die erwarteten Durchschnittswerte ist das Intervall für vorhergesagte Einzelwerte in der Mitte kleiner als an den Rändern, weil die Berechnung der Regressionslinie im Zentrum stabiler ist. Beachte, dass die Intervalle für die durchschnittlichen Antworten deutlich kleiner sind als die Intervalle für die einzelnen Antworten.

Du hast tidy() schon kennengelernt, um Informationen auf Koeffizientenebene aus einem Modell zu ziehen, und augment() für Informationen auf Beobachtungsebene. glance() vervollständigt das Trio und liefert dir Informationen auf Modellebene.

Die lineare Regression ist als model gegeben, und die Vorhersagen aus der vorherigen Übung als predictions.

Diese Übung ist Teil des Kurses

<Kurs>Schlussfolgern bei der linearen Regression in R</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

twins_sigma <- model %>%
  # Get model-level information
  ___ %>%
  # Pull out sigma
  ___

predictions %>%
  # Calculate the std err of the predictions
  mutate(std_err_of_predictions = ___)

Code bearbeiten und ausführen