Erste SchritteKostenlos loslegen

Berechnung der Mittelwerte nach Kategorie

Eine gute Möglichkeit, kategoriale Variablen weiter zu untersuchen, ist die Berechnung von zusammenfassenden Statistiken für jede Kategorie. Du kannst zum Beispiel den Mittelwert und den Median deiner Antwortvariablen berechnen, gruppiert nach einer kategorialen Variable. So kannst du jede Kategorie detaillierter vergleichen.

Hier siehst du dir die gruppierten Mittelwerte für die Hauspreise im Taiwan-Immobilien-Datensatz an. Das hilft dir, die Ergebnisse einer linearen Regression mit einer kategorialen Variable zu verstehen.

taiwan_real_estate ist als pandas DataFrame verfügbar.

Diese Übung ist Teil des Kurses

Einführung in die Regression mit statsmodels in Python

Kurs anzeigen

Anleitung zur Übung

  • Gruppiere taiwan_real_estate nach house_age_years und berechne den Durchschnittspreis (price_twd_msq) für jede Altersgruppe. Weise das Ergebnis mean_price_by_age zu.
  • Drucke das Ergebnis aus und prüfe die Ausgabe.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____

# Print the result
print(____)
Bearbeiten und Ausführen von Code