ComenzarEmpieza gratis

Detectar valores atípicos con IForest

IForest es un estimador robusto y solo necesita unas pocas líneas de código para detectar valores atípicos en cualquier conjunto de datos. Verás que esta sintaxis te resulta familiar, ya que se parece mucho a la de sklearn.

La versión completa de los datos de Big Mart Sales se ha cargado como big_mart, que puedes explorar en la consola.

Este ejercicio forma parte del curso

Detección de anomalías en Python

Ver curso

Instrucciones del ejercicio

  • Importa el estimador IForest desde pyod.
  • Inicializa un IForest() con los parámetros por defecto.
  • Ajusta el estimador y genera predicciones sobre big_mart simultáneamente, y guarda los resultados en labels.
  • Usa el filtrado de pandas para extraer los valores atípicos de big_mart.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import IForest from pyod
from pyod.____ import ____

# Initialize an instance with default parameters
iforest = ____

# Generate outlier labels
labels = ____

# Filter big_mart for outliers
outliers = ____

print(outliers.shape)
Editar y ejecutar código