IniziaInizia gratis

Regressioni bootstrap

Mentre lavori per il dipartimento parchi e attività ricreative di Long Beach per indagare la relazione tra NO2 e SO2, hai notato un gruppo di potenziali outlier che potrebbero falsare le correlazioni.

SO2 NO2 scatter

Esplora l'incertezza delle tue correlazioni tramite bootstrap resampling per vedere quanto sono stabili i tuoi fit. Per comodità, il campionamento bootstrap è già stato eseguito ed è fornito come no2_so2_boot insieme a no2_so2 per i dati non ricampionati.

Questo esercizio fa parte del corso

Migliorare le tue visualizzazioni dei dati in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Fai sapere a sns.lmplot() che deve disegnare una linea di regressione separata per ciascun sample del bootstrap.
  • Colora ogni linea di regressione 'steelblue' e rendile opache al 20%.
  • Disattiva le confidence band predefinite di Seaborn attorno alle linee di regressione.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

sns.lmplot('NO2', 'SO2', data = no2_so2_boot,
           # Tell seaborn to a regression line for each sample
           ____ = 'sample', 
           # Make lines blue and transparent
           line_kws = {'____': 'steelblue', '____': 0.2},
           # Disable built-in confidence intervals
           ci = ____, legend = False, scatter = False)

# Draw scatter of all points
plt.scatter('NO2', 'SO2', data = no2_so2)

plt.show()
Modifica ed esegui il codice