Otra forma de clasificar con IForest
Hasta ahora, has estado usando el método .fit_predict() para ajustar IForest y generar predicciones a la vez. Sin embargo, la documentación de pyod recomienda usar primero la función fit y acceder a las labels_ de inliers/outliers mediante un práctico atributo.
Vas a practicar esto con el conjunto de datos big_mart.
Este ejercicio forma parte del curso
Detección de anomalías en Python
Instrucciones del ejercicio
- Ajusta (solo
fit) el estimadorIForest()abig_mart. - Accede a las etiquetas de entrenamiento y guárdalas como
labels. - Usa subsetting de
pandasenbig_martpara filtrar los outliers enoutliers.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
iforest = IForest(n_estimators=200)
# Fit (only fit) it to the Big Mart sales
____
# Access the labels_ for the data
labels = iforest.____
# Filter outliers from big_mart
outliers = ____[____]
print(len(outliers))