CommencerCommencer gratuitement

Choisir n_estimators

n_estimators est le paramètre qui influence le plus les performances du modèle. Construire IForest avec suffisamment d’arbres garantit que l’algorithme dispose d’un pouvoir de généralisation suffisant pour isoler les valeurs aberrantes des points normaux. Le nombre optimal d’arbres dépend de la taille du jeu de données, et une valeur trop élevée ou trop faible conduira à des prédictions inexactes.

Entraînez-vous à définir n_estimators sur le jeu de données big_mart, qui a été chargé pour vous ainsi que IForest depuis pyod.

Cet exercice fait partie du cours

Détection d’anomalies en Python

Afficher le cours

Instructions

  • Créez un estimateur IForest() avec 300 iTrees.
  • Ajustez l’instance sur big_mart.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create an IForest with 300 trees
iforest = ____

# Fit to the Big Mart sales data
____
Modifier et exécuter le code