Numeriek vs. categorisch visualiseren
Als de verklarende variabele categorisch is, heeft de spreidingsplot die je eerder gebruikte om de data te visualiseren geen zin. In plaats daarvan is het een goed idee om per categorie een histogram te tekenen.
De Taiwan-vastgoedgegevensset heeft een categorische variabele in de vorm van de leeftijd van elk huis. De leeftijden zijn opgedeeld in 3 groepen: 0 tot 15 jaar, 15 tot 30 jaar en 30 tot 45 jaar.
taiwan_real_estate is beschikbaar en ggplot2 is geladen.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie in R
Oefeninstructies
- Gebruik
taiwan_real_estateom een histogram vanprice_twd_msqte plotten met10bins. - Facet de plot op
house_age_yearszodat je 3 panelen krijgt.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Using taiwan_real_estate, plot price_twd_msq
___ +
# Make it a histogram with 10 bins
___ +
# Facet the plot so each house age group gets its own panel
___