Visualiseren: numeriek vs. categorisch
Als de verklarende variabele categorisch is, heeft de spreidingsplot die je eerder gebruikte om de data te visualiseren geen zin. Een goede optie is dan om voor elke categorie een histogram te tekenen.
De Taiwan-vastgoedgegevensset heeft een categorische variabele in de vorm van de leeftijd van elk huis. De leeftijden zijn opgesplitst in 3 groepen: 0 tot 15 jaar, 15 tot 30 jaar en 30 tot 45 jaar.
taiwan_real_estate is beschikbaar.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Oefeninstructies
- Gebruik
taiwan_real_estateom een histogram vanprice_twd_msqte tekenen met10bins. Splits de plot ophouse_age_yearsom 3 panelen te krijgen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Histograms of price_twd_msq with 10 bins, split by the age of each house
sns.____(data=____,
x=____,
____=____,
____=____)
# Show the plot
____