Calculer les seuils d’anomalies avec l’IQR
Visualiser des valeurs aberrantes n’est généralement que la première étape pour les détecter. Pour aller au‑delà de la simple visualisation, vous devrez écrire du code qui isole les valeurs aberrantes de la distribution.
Dans cet exercice, vous allez implémenter la première étape de ce que fait un boxplot en arrière-plan. En d’autres termes, vous allez calculer manuellement les seuils inférieur et supérieur des valeurs aberrantes.
La distribution est disponible sous le nom prices.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Calculez les premier et troisième quartiles de
priceset stockez-les dansq1etq3, respectivement. - Calculez l’IQR et stockez-le dans
IQR. - Calculez la limite inférieure des valeurs aberrantes dans
lower_limit. - Calculez la limite supérieure des valeurs aberrantes dans
upper_limit.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the 25th and 75th percentiles
q1 = prices.____(____)
q3 = prices.____(____)
# Find the IQR
IQR = ____
factor = 2.5
# Calculate the lower limit
lower_limit = ____ - ____
# Calculate the upper limit
upper_limit = ____ + ____