Elegir n_estimators
n_estimators es el parámetro que más influye en el rendimiento del modelo. Construir IForest con suficientes árboles garantiza que el algoritmo tenga suficiente capacidad de generalización para aislar los outliers de los puntos de datos normales. El número óptimo de árboles depende del tamaño del conjunto de datos, y un valor demasiado alto o demasiado bajo llevará a predicciones imprecisas.
Practica cómo establecer n_estimators con el conjunto de datos big_mart, que ya se ha cargado para ti junto con IForest de pyod.
Este ejercicio forma parte del curso
Detección de anomalías en Python
Instrucciones del ejercicio
- Crea un estimador
IForest()con 300 iTrees. - Ajusta la instancia a
big_mart.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create an IForest with 300 trees
iforest = ____
# Fit to the Big Mart sales data
____