Detectar valores atípicos con IForest
IForest es un estimador robusto y solo necesita unas pocas líneas de código para detectar valores atípicos en cualquier conjunto de datos. Verás que esta sintaxis te resulta familiar, ya que se parece mucho a la de sklearn.
La versión completa de los datos de Big Mart Sales se ha cargado como big_mart, que puedes explorar en la consola.
Este ejercicio forma parte del curso
Detección de anomalías en Python
Instrucciones del ejercicio
- Importa el estimador
IForestdesdepyod. - Inicializa un
IForest()con los parámetros por defecto. - Ajusta el estimador y genera predicciones sobre
big_martsimultáneamente, y guarda los resultados enlabels. - Usa el filtrado de
pandaspara extraer los valores atípicos debig_mart.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import IForest from pyod
from pyod.____ import ____
# Initialize an instance with default parameters
iforest = ____
# Generate outlier labels
labels = ____
# Filter big_mart for outliers
outliers = ____
print(outliers.shape)