Geboostrappte regressies
Terwijl je voor de afdeling parken en recreatie van Long Beach de relatie tussen NO2 en SO2 onderzocht, zag je een cluster met mogelijke uitschieters dat vermoedelijk de correlaties verstoort.

Onderzoek de onzekerheid in je correlaties via bootstrap-resampling om te zien hoe stabiel je fits zijn. Voor het gemak is het bootstrap-sampling al uitgevoerd en beschikbaar als no2_so2_boot, samen met no2_so2 voor de niet-geresamplede data.
Deze oefening maakt deel uit van de cursus
Je datavisualisaties verbeteren in Python
Oefeninstructies
- Laat
sns.lmplot()weten dat er een aparte regressielijn moet worden getekend voor elke bootstrap-sample. - Geef elke regressielijn de kleur
'steelblue'en maak ze 20% transparant. - Schakel de standaard Seaborn-confidencebands rond de regressielijnen uit.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
sns.lmplot('NO2', 'SO2', data = no2_so2_boot,
# Tell seaborn to a regression line for each sample
____ = 'sample',
# Make lines blue and transparent
line_kws = {'____': 'steelblue', '____': 0.2},
# Disable built-in confidence intervals
ci = ____, legend = False, scatter = False)
# Draw scatter of all points
plt.scatter('NO2', 'SO2', data = no2_so2)
plt.show()