CommencerCommencer gratuitement

Détecter des anomalies avec IForest

IForest est un estimateur robuste et ne nécessite que quelques lignes de code pour détecter des anomalies dans n’importe quel jeu de données. Cette syntaxe vous semblera familière, car elle ressemble beaucoup à celle de sklearn.

La version complète des données Big Mart Sales a été chargée pour vous sous le nom big_mart, que vous pouvez explorer dans la console.

Cet exercice fait partie du cours

Détection d’anomalies en Python

Afficher le cours

Instructions

  • Importez l’estimateur IForest depuis pyod.
  • Initialisez un IForest() avec les paramètres par défaut.
  • Ajustez l’estimateur et générez les prédictions sur big_mart simultanément, puis stockez les résultats dans labels.
  • Utilisez le sous-ensemble pandas pour filtrer les anomalies de big_mart.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import IForest from pyod
from pyod.____ import ____

# Initialize an instance with default parameters
iforest = ____

# Generate outlier labels
labels = ____

# Filter big_mart for outliers
outliers = ____

print(outliers.shape)
Modifier et exécuter le code