Twee numerieke variabelen visualiseren
Voordat je statistische modellen gaat draaien, is het meestal verstandig om je gegevens eerst te visualiseren. Hier bekijk je de relatie tussen de huizenprijs per oppervlakte en het aantal nabijgelegen buurtwinkels met de Taiwan-realestatedataset.
Een uitdaging in deze gegevensset is dat het aantal buurtwinkels gehele getallen bevat, waardoor punten overlappen. Om dit op te lossen maak je de punten transparant.
taiwan_real_estate is beschikbaar als een pandas DataFrame.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import seaborn with alias sns
____
# Import matplotlib.pyplot with alias plt
____
# Draw the scatter plot
sns.____(____)
# Show the plot
plt.____()