Détecter des anomalies avec IForest
IForest est un estimateur robuste et ne nécessite que quelques lignes de code pour détecter des anomalies dans n’importe quel jeu de données. Cette syntaxe vous semblera familière, car elle ressemble beaucoup à celle de sklearn.
La version complète des données Big Mart Sales a été chargée pour vous sous le nom big_mart, que vous pouvez explorer dans la console.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Importez l’estimateur
IForestdepuispyod. - Initialisez un
IForest()avec les paramètres par défaut. - Ajustez l’estimateur et générez les prédictions sur
big_martsimultanément, puis stockez les résultats danslabels. - Utilisez le sous-ensemble
pandaspour filtrer les anomalies debig_mart.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import IForest from pyod
from pyod.____ import ____
# Initialize an instance with default parameters
iforest = ____
# Generate outlier labels
labels = ____
# Filter big_mart for outliers
outliers = ____
print(outliers.shape)