Twee variabelen visualiseren
Voordat je statistische modellen gaat draaien, is het meestal een goed idee om je gegevensset te visualiseren. Hier bekijken we de relatie tussen de woningprijs per oppervlakte en het aantal nabijgelegen buurtwinkels, met de Taiwan real estate-gegevensset.
Een uitdaging in deze gegevensset is dat het aantal buurtwinkels gehele getallen bevat, waardoor punten overlappen. Om dit op te lossen maak je de punten transparant.
taiwan_real_estate is beschikbaar, ggplot2 is geladen en het zwart-witthema is ingesteld.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Draw a scatter plot of n_convenience vs. price_twd_msq
___