Aan de slagGa gratis aan de slag

Geboostrappte regressies

Terwijl je voor de afdeling parken en recreatie van Long Beach de relatie tussen NO2 en SO2 onderzocht, zag je een cluster met mogelijke uitschieters dat vermoedelijk de correlaties verstoort.

SO2 NO2 scatter

Onderzoek de onzekerheid in je correlaties via bootstrap-resampling om te zien hoe stabiel je fits zijn. Voor het gemak is het bootstrap-sampling al uitgevoerd en beschikbaar als no2_so2_boot, samen met no2_so2 voor de niet-geresamplede data.

Deze oefening maakt deel uit van de cursus

Je datavisualisaties verbeteren in Python

Cursus bekijken

Oefeninstructies

  • Laat sns.lmplot() weten dat er een aparte regressielijn moet worden getekend voor elke bootstrap-sample.
  • Geef elke regressielijn de kleur 'steelblue' en maak ze 20% transparant.
  • Schakel de standaard Seaborn-confidencebands rond de regressielijnen uit.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

sns.lmplot('NO2', 'SO2', data = no2_so2_boot,
           # Tell seaborn to a regression line for each sample
           ____ = 'sample', 
           # Make lines blue and transparent
           line_kws = {'____': 'steelblue', '____': 0.2},
           # Disable built-in confidence intervals
           ci = ____, legend = False, scatter = False)

# Draw scatter of all points
plt.scatter('NO2', 'SO2', data = no2_so2)

plt.show()
Code bewerken en uitvoeren