Sensibilité aux valeurs aberrantes
Lorsque vous analysez la relation entre plusieurs variables, la corrélation est un excellent point de départ. Mais comment se comporte-t-elle sur des jeux de données plus particuliers ? Résiste-t-elle bien aux valeurs aberrantes ?
Dans cet exercice, vous allez tracer et calculer la corrélation pour un jeu de données contenant une valeur aberrante, puis la supprimer pour voir ce qui change. À la fin, vous évaluerez les performances de la corrélation et en tirerez une conclusion sur quand et où l’utiliser.
Un échantillon issu du célèbre quartet d’Anscombe a été importé pour vous dans la variable df, ainsi que tous les paquets utilisés précédemment dans ce chapitre.
Cet exercice fait partie du cours
S’entraîner aux questions d’entretien en statistiques avec Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()