Autre façon de classifier avec IForest

Jusqu’ici, vous avez utilisé la méthode .fit_predict() pour ajuster IForest et générer les prédictions en même temps. Cependant, la documentation de pyod recommande d’appeler d’abord la fonction fit, puis d’accéder aux étiquettes inlier/outlier via un attribut pratique, labels_.

Vous allez vous entraîner avec le jeu de données big_mart.

Cet exercice fait partie du cours

<cours>Détection d’anomalies en Python</cours>

Voir le cours

Instructions de l’exercice

Ajustez (uniquement fit) l’estimateur IForest() sur big_mart.
Accédez aux étiquettes d’entraînement et stockez‑les dans labels.
Utilisez le sous‑ensemble pandas sur big_mart pour filtrer les valeurs aberrantes dans outliers.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

iforest = IForest(n_estimators=200)

# Fit (only fit) it to the Big Mart sales
____

# Access the labels_ for the data
labels = iforest.____

# Filter outliers from big_mart
outliers = ____[____]

print(len(outliers))

Modifier et exécuter le code