Identifier les valeurs aberrantes
Continuons avec notre jeu de données laptops et attaquons quelques valeurs aberrantes bien cachées. Dans cet exercice, nous allons nous en tenir à la première technique évoquée dans le diaporama, qui consiste à utiliser les écarts types pour repérer les valeurs extrêmes, car c’est la méthode la plus courante en pratique.
Vous allez calculer les statistiques descriptives et les bornes d’exclusion, puis identifier les lignes correspondantes avant de les supprimer du jeu de données. Vous travaillerez principalement avec la colonne Price.
Cet exercice fait partie du cours
S’entraîner aux questions d’entretien en statistiques avec Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the mean and std
mean, std = ____, ____