Berechnung der Mittelwerte nach Kategorie
Eine gute Möglichkeit, kategoriale Variablen weiter zu untersuchen, ist die Berechnung von zusammenfassenden Statistiken für jede Kategorie. Du kannst zum Beispiel den Mittelwert und den Median deiner Antwortvariablen berechnen, gruppiert nach einer kategorialen Variable. So kannst du jede Kategorie detaillierter vergleichen.
Hier siehst du dir die gruppierten Mittelwerte für die Hauspreise im Taiwan-Immobilien-Datensatz an. Das hilft dir, die Ergebnisse einer linearen Regression mit einer kategorialen Variable zu verstehen.
taiwan_real_estate
ist als pandas
DataFrame verfügbar.
Diese Übung ist Teil des Kurses
Einführung in die Regression mit statsmodels in Python
Anleitung zur Übung
- Gruppiere
taiwan_real_estate
nachhouse_age_years
und berechne den Durchschnittspreis (price_twd_msq
) für jede Altersgruppe. Weise das Ergebnismean_price_by_age
zu. - Drucke das Ergebnis aus und prüfe die Ausgabe.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____
# Print the result
print(____)