Mittelwerte nach Kategorie berechnen
Eine gute Möglichkeit, kategoriale Variablen weiter zu erkunden, ist, für jede Kategorie zusammenfassende Statistiken zu berechnen. Du kannst zum Beispiel den Mittelwert und den Median deiner Zielvariable berechnen, gruppiert nach einer kategorialen Variable. So lässt sich jede Kategorie genauer vergleichen.
Hier schaust du dir gruppierte Mittelwerte für die Hauspreise im Taiwan-Immobiliendatensatz an. Das hilft dir, die Ausgabe einer linearen Regression mit einer kategorialen Variable zu verstehen.
taiwan_real_estate steht dir als pandas DataFrame zur Verfügung.
Diese Übung ist Teil des Kurses
Einführung in Regression mit statsmodels in Python
Anleitung zur Übung
- Gruppiere
taiwan_real_estatenachhouse_age_yearsund berechne den Mittelwert des Preises (price_twd_msq) für jede Altersgruppe. Weise das Ergebnismean_price_by_agezu. - Gib das Ergebnis aus und inspiziere die Ausgabe.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____
# Print the result
print(____)