Scelta di n_estimators
n_estimators è il parametro che influenza di più le prestazioni del modello. Costruire IForest con un numero sufficiente di alberi garantisce che l'algoritmo abbia abbastanza capacità di generalizzazione per isolare gli outlier dai punti dati normali. Il numero ottimale di alberi dipende dalla dimensione dell'insieme di dati e valori troppo alti o troppo bassi porteranno a previsioni inaccurate.
Esercitati a impostare n_estimators sul dataset big_mart, che è stato caricato per te insieme a IForest da pyod.
Questo esercizio fa parte del corso
Rilevamento delle anomalie in Python
Istruzioni dell'esercizio
- Crea un stimatore
IForest()con 300 iTrees. - Esegui il fit dell'istanza su
big_mart.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create an IForest with 300 trees
iforest = ____
# Fit to the Big Mart sales data
____