Aan de slagGa gratis aan de slag

Visualiseren: numeriek vs. categorisch

Als de verklarende variabele categorisch is, heeft de spreidingsplot die je eerder gebruikte om de data te visualiseren geen zin. Een goede optie is dan om voor elke categorie een histogram te tekenen.

De Taiwan-vastgoedgegevensset heeft een categorische variabele in de vorm van de leeftijd van elk huis. De leeftijden zijn opgesplitst in 3 groepen: 0 tot 15 jaar, 15 tot 30 jaar en 30 tot 45 jaar.

taiwan_real_estate is beschikbaar.

Deze oefening maakt deel uit van de cursus

Introductie tot regressie met statsmodels in Python

Cursus bekijken

Oefeninstructies

  • Gebruik taiwan_real_estate om een histogram van price_twd_msq te tekenen met 10 bins. Splits de plot op house_age_years om 3 panelen te krijgen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Histograms of price_twd_msq with 10 bins, split by the age of each house
sns.____(data=____,
         x=____,
         ____=____,
         ____=____)

# Show the plot
____
Code bewerken en uitvoeren