Visualisierung numerischer und kategorialer Daten
Wenn die erklärende Variable kategorisch ist, macht das Streudiagramm, das du zuvor zur Visualisierung der Daten verwendet hast, keinen Sinn. Stattdessen ist es eine gute Option, für jede Kategorie ein Histogramm zu zeichnen.
Der taiwanesische Immobiliendatensatz enthält eine kategoriale Variable in Form des Alters der einzelnen Häuser. Die Altersgruppen wurden in 3 Gruppen aufgeteilt: 0 bis 15 Jahre, 15 bis 30 Jahre und 30 bis 45 Jahre.
taiwan_real_estate
ist verfügbar.
Diese Übung ist Teil des Kurses
Einführung in die Regression mit statsmodels in Python
Anleitung zur Übung
- Zeichne mit
taiwan_real_estate
ein Histogramm vonprice_twd_msq
mit10
Bins. Teile den Plot durchhouse_age_years
, um 3 Panels zu erhalten.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Histograms of price_twd_msq with 10 bins, split by the age of each house
sns.____(data=____,
x=____,
____=____,
____=____)
# Show the plot
____