Parallele Steigungen visualisieren
Die beiden Diagramme in der vorherigen Übung lieferten sehr unterschiedliche Vorhersagen: Eines ergab eine vorhergesagte Antwort, die mit einer numerischen Variable linear anstieg; das andere gab für jede Kategorie einen festen Wert aus. Der einzige sinnvolle Weg, diese beiden widersprüchlichen Vorhersagen zu vereinbaren, besteht darin, beide erklärenden Variablen gleichzeitig ins Modell aufzunehmen.
Für ein lineares Regressionsmodell mit einer numerischen und einer kategorialen erklärenden Variable bietet ggplot2 keine einfache Lösung „out of the box“, um die Vorhersagen darzustellen. Zum Glück enthält das Paket moderndive ein zusätzliches Geom, geom_parallel_slopes(), das dies erleichtert.
taiwan_real_estate ist verfügbar; ggplot2 und moderndive sind geladen.
Diese Übung ist Teil des Kurses
Fortgeschrittene Regression in R
Anleitung zur Übung
- Nutze den Datensatz
taiwan_real_estate, um Hauspreise gegen die Anzahl nahegelegener Convenience Stores zu plotten, eingefärbt nach dem Hausalter. - Erstelle ein Streudiagramm.
- Füge parallele Steigungen ohne Standardfehlerband hinzu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Using taiwan_real_estate, plot price_twd_msq vs. n_convenience colored by house_age_years
___ +
# Add a point layer
___ +
# Add parallel slopes, no ribbon
___