Konfidenzintervalle für die durchschnittliche Antwort für alle Beobachtungen
Das Konfidenzintervall für die durchschnittliche Antwort kann für alle Beobachtungen im Datensatz berechnet werden. Wenn du augment() direkt auf den Datensatz twins anwendest, erhältst du Vorhersagen und Standardfehler für den Pflegezwilling (Foster) basierend auf allen biologischen Beobachtungen.
Beachte, dass die Berechnung der Regressionsgeraden in der Mitte stabiler ist, daher sind Vorhersagen an den Extremwerten variabler als Vorhersagen in der Mitte des Bereichs der erklärenden IQs.
Die IQ-Vorhersagen für den Pflegezwilling, die du letztes Mal berechnet hast, sind als predictions gegeben. Diese Vorhersagen werden in einem Plot mit geom_smooth() angezeigt.
Diese Übung ist Teil des Kurses
Schlussfolgern bei der linearen Regression in R
Anleitung zur Übung
Repliziere manuell, was geom_smooth() macht, und verwende dafür predictions. Gib für jedes Geom die Ästhetiken und die Daten an.
- Füge eine Punkt-Ebene von
FostergegenBiologicalhinzu und nutze den Datensatzdata = twins. - Füge eine Linien-Ebene von
.fittedgegenBiologicalhinzu und nutze den Datensatzdata = predictions. Färbe die Linie"blue". - Füge eine Ribbon-Ebene hinzu, bei der
xaufBiological,yminauflower_mean_predictionundymaxaufupper_mean_predictiongemappt wird. Verwende den Datensatzdata = predictionsund setze die Transparenzalphaauf0.2.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# This plot is shown
ggplot(twins, aes(x = Biological, y = Foster)) +
geom_point() +
geom_smooth(method = "lm")
ggplot() +
# Add a point layer of Foster vs. Biological, using twins
___(aes(___, ___), data = ___) +
# Add a line layer of .fitted vs Biological, using predictions, colored blue
___ +
# Add a ribbon layer of lower_mean_prediction to upper_mean_prediction vs Biological,
# using predictions, transparency of 0.2
___