Berechnung der Mittelwerte nach Kategorie
Eine gute Möglichkeit, kategoriale Variablen weiter zu untersuchen, ist die Berechnung von zusammenfassenden Statistiken für jede Kategorie. Du kannst zum Beispiel den Mittelwert und den Median deiner Antwortvariablen berechnen, gruppiert nach einer kategorialen Variable. So kannst du jede Kategorie detaillierter vergleichen.
Hier siehst du dir die gruppierten Mittelwerte für die Hauspreise im Taiwan-Immobilien-Datensatz an. Das hilft dir, die Ergebnisse einer linearen Regression mit einer kategorialen Variable zu verstehen.
taiwan_real_estate ist als pandas DataFrame verfügbar.
Diese Übung ist Teil des Kurses
Einführung in die Regression mit statsmodels in Python
Anleitung zur Übung
- Gruppiere
taiwan_real_estatenachhouse_age_yearsund berechne den Durchschnittspreis (price_twd_msq) für jede Altersgruppe. Weise das Ergebnismean_price_by_agezu. - Drucke das Ergebnis aus und prüfe die Ausgabe.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____
# Print the result
print(____)