IniziaInizia gratis

Sensibilità agli outlier

Quando analizzi la relazione tra più variabili, la correlazione è un ottimo punto di partenza. Ma come se la cava con insiemi di dati più interessanti? Quanto è robusta rispetto agli outlier?

In questo esercizio, tracerai e calcolerai la correlazione per un insieme di dati che contiene un outlier, poi lo rimuoverai per vedere cosa cambia. Alla fine, l’obiettivo è capire come si comporta la correlazione e arrivare a una conclusione su quando e dove dovresti usarla.

Un insieme di dati di esempio tratto dal famoso Anscombe's quartet è stato importato per te nella variabile df, insieme a tutti i pacchetti usati in questo capitolo.

Questo esercizio fa parte del corso

Esercitarsi con le domande di statistica per i colloqui in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()
Modifica ed esegui il codice