CommencerCommencer gratuitement

Sensibilité aux valeurs aberrantes

Lorsque vous analysez la relation entre plusieurs variables, la corrélation est un excellent point de départ. Mais comment se comporte-t-elle sur des jeux de données plus particuliers ? Résiste-t-elle bien aux valeurs aberrantes ?

Dans cet exercice, vous allez tracer et calculer la corrélation pour un jeu de données contenant une valeur aberrante, puis la supprimer pour voir ce qui change. À la fin, vous évaluerez les performances de la corrélation et en tirerez une conclusion sur quand et où l’utiliser.

Un échantillon issu du célèbre quartet d’Anscombe a été importé pour vous dans la variable df, ainsi que tous les paquets utilisés précédemment dans ce chapitre.

Cet exercice fait partie du cours

S’entraîner aux questions d’entretien en statistiques avec Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()
Modifier et exécuter le code