Escolhendo n_estimators
n_estimators é o parâmetro que mais influencia o desempenho do modelo. Construir um IForest com árvores suficientes garante que o algoritmo tenha poder de generalização para isolar os outliers dos pontos normais. O número ideal de árvores depende do tamanho do conjunto de dados, e valores muito altos ou muito baixos levam a previsões imprecisas.
Pratique definir n_estimators no conjunto de dados big_mart, que já foi carregado para você junto com IForest do pyod.
Este exercício faz parte do curso
Detecção de Anomalias em Python
Instruções do exercício
- Crie um estimador
IForest()com 300 iTrees. - Treine a instância com
big_mart.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create an IForest with 300 trees
iforest = ____
# Fit to the Big Mart sales data
____