Filtrer à l’aide des bornes d’anomalie
Dans l’exercice précédent, vous avez déterminé les bornes qui serviront à catégoriser les valeurs aberrantes. Dans cet exercice, vous allez les appliquer à la distribution prices pour isoler les valeurs aberrantes.
Les variables prices, lower_limit et upper_limit sont disponibles depuis l’exercice précédent.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Créez un masque booléen nommé
is_lowerqui vérifie si les valeurs de prices sont inférieures àlower_limit. - Créez un masque booléen nommé
is_higherqui vérifie si les valeurs de prices sont supérieures àupper_limit. - Combinez les masques et utilisez un sous-ensemble booléen pour filtrer les valeurs aberrantes.
- Affichez le nombre de valeurs aberrantes trouvées.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a mask for values lower than lower_limit
is_lower = ____
# Create a mask for values higher than upper_limit
is_higher = ____
# Combine the masks to filter for outliers
outliers = ____[____]
# Count and print the number of outliers
____