Autre façon de classifier avec IForest
Jusqu’ici, vous avez utilisé la méthode .fit_predict() pour ajuster IForest et générer les prédictions en même temps. Cependant, la documentation de pyod recommande d’appeler d’abord la fonction fit, puis d’accéder aux étiquettes inlier/outlier via un attribut pratique, labels_.
Vous allez vous entraîner avec le jeu de données big_mart.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Ajustez (uniquement
fit) l’estimateurIForest()surbig_mart. - Accédez aux étiquettes d’entraînement et stockez‑les dans
labels. - Utilisez le sous‑ensemble
pandassurbig_martpour filtrer les valeurs aberrantes dansoutliers.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
iforest = IForest(n_estimators=200)
# Fit (only fit) it to the Big Mart sales
____
# Access the labels_ for the data
labels = iforest.____
# Filter outliers from big_mart
outliers = ____[____]
print(len(outliers))