LoslegenKostenlos loslegen

Mittelwerte nach Kategorie berechnen

Eine gute Möglichkeit, kategoriale Variablen weiter zu erkunden, ist, für jede Kategorie zusammenfassende Statistiken zu berechnen. Du kannst zum Beispiel den Mittelwert und den Median deiner Zielvariable berechnen, gruppiert nach einer kategorialen Variable. So lässt sich jede Kategorie genauer vergleichen.

Hier schaust du dir gruppierte Mittelwerte für die Hauspreise im Taiwan-Immobiliendatensatz an. Das hilft dir, die Ausgabe einer linearen Regression mit einer kategorialen Variable zu verstehen.

taiwan_real_estate steht dir als pandas DataFrame zur Verfügung.

Diese Übung ist Teil des Kurses

Einführung in Regression mit statsmodels in Python

Kurs anzeigen

Anleitung zur Übung

  • Gruppiere taiwan_real_estate nach house_age_years und berechne den Mittelwert des Preises (price_twd_msq) für jede Altersgruppe. Weise das Ergebnis mean_price_by_age zu.
  • Gib das Ergebnis aus und inspiziere die Ausgabe.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____

# Print the result
print(____)
Code bearbeiten und ausführen