Sensibilità agli outlier
Quando analizzi la relazione tra più variabili, la correlazione è un ottimo punto di partenza. Ma come se la cava con insiemi di dati più interessanti? Quanto è robusta rispetto agli outlier?
In questo esercizio, tracerai e calcolerai la correlazione per un insieme di dati che contiene un outlier, poi lo rimuoverai per vedere cosa cambia. Alla fine, l’obiettivo è capire come si comporta la correlazione e arrivare a una conclusione su quando e dove dovresti usarla.
Un insieme di dati di esempio tratto dal famoso Anscombe's quartet è stato importato per te nella variabile df, insieme a tutti i pacchetti usati in questo capitolo.
Questo esercizio fa parte del corso
Esercitarsi con le domande di statistica per i colloqui in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()