Choisir n_estimators
n_estimators est le paramètre qui influence le plus les performances du modèle. Construire IForest avec suffisamment d’arbres garantit que l’algorithme dispose d’un pouvoir de généralisation suffisant pour isoler les valeurs aberrantes des points normaux. Le nombre optimal d’arbres dépend de la taille du jeu de données, et une valeur trop élevée ou trop faible conduira à des prédictions inexactes.
Entraînez-vous à définir n_estimators sur le jeu de données big_mart, qui a été chargé pour vous ainsi que IForest depuis pyod.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Créez un estimateur
IForest()avec 300 iTrees. - Ajustez l’instance sur
big_mart.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create an IForest with 300 trees
iforest = ____
# Fit to the Big Mart sales data
____