Houdt de breedtegraad verband met het aantal open maanden?
Tijdens het verkennen van de farmers market-gegevensset met een scattermatrix viel je een mogelijk interessant verband op tussen de breedtegraad van een markt en het aantal maanden dat deze open is. Om dit verder te onderzoeken, besluit je Seaborn's regressieplot te gebruiken om te zien of dit patroon echt is of dat de sterke overlap van de punten je voor de gek houdt.
Om de regressielijn te laten opvallen, wil je de dekking (opacity) van de overlappende achtergrondpunten verlagen en ze een gedempte grijze kleur geven. Omdat je geen formele inferentie gaat doen en snel een patroon wilt verkennen, kun je de standaard onzekerheidsband uitschakelen.
Deze oefening maakt deel uit van de cursus
Je datavisualisaties verbeteren in Python
Oefeninstructies
- Zet de opacity van de punten in de scatterplot op 10% en geef ze de kleur
'gray'. - Schakel de standaard betrouwbaarheidsinterval-band uit.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
sns.regplot(x = 'lat',
y = 'months_open',
# Set scatter point opacity & color
____ = {'alpha':____, 'color':'____'},
# Disable confidence band
____ = ____,
data = markets)
plt.show()