CommencerCommencez gratuitement

Sensibilité aux valeurs aberrantes

Lorsque vous analysez la relation entre plusieurs variables, la corrélation est un excellent point de départ. Mais comment se comporte-t-elle sur des jeux de données plus particuliers ? Résiste-t-elle bien aux valeurs aberrantes ?

Dans cet exercice, vous allez tracer et calculer la corrélation pour un jeu de données contenant une valeur aberrante, puis la supprimer pour voir ce qui change. À la fin, vous évaluerez les performances de la corrélation et en tirerez une conclusion sur quand et où l’utiliser.

Un échantillon issu du célèbre quartet d’Anscombe a été importé pour vous dans la variable df, ainsi que tous les paquets utilisés précédemment dans ce chapitre.

Cet exercice fait partie du cours

<cours>S’entraîner aux questions d’entretien en statistiques avec Python</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()
Modifier et exécuter le code