LoslegenKostenlos starten

Mittelwerte nach Kategorie berechnen

Eine gute Möglichkeit, kategoriale Variablen weiter zu erkunden, ist, für jede Kategorie zusammenfassende Statistiken zu berechnen. Du kannst zum Beispiel den Mittelwert und den Median deiner Zielvariable berechnen, gruppiert nach einer kategorialen Variable. So lässt sich jede Kategorie genauer vergleichen.

Hier schaust du dir gruppierte Mittelwerte für die Hauspreise im Taiwan-Immobiliendatensatz an. Das hilft dir, die Ausgabe einer linearen Regression mit einer kategorialen Variable zu verstehen.

taiwan_real_estate steht dir als pandas DataFrame zur Verfügung.

Diese Übung ist Teil des Kurses

<Kurs>Einführung in die Regression mit statsmodels in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Gruppiere taiwan_real_estate nach house_age_years und berechne den Mittelwert des Preises (price_twd_msq) für jede Altersgruppe. Weise das Ergebnis mean_price_by_age zu.
  • Gib das Ergebnis aus und inspiziere die Ausgabe.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____

# Print the result
print(____)
Code bearbeiten und ausführen