ComeçarComece de graça

Detectando outliers com IForest

O IForest é um estimador robusto e precisa de poucas linhas de código para detectar outliers em qualquer conjunto de dados. Essa sintaxe pode parecer familiar, pois se parece muito com a do sklearn.

A versão completa dos dados de vendas da Big Mart foi carregada para você como big_mart, que você pode explorar no console.

Este exercício faz parte do curso

Detecção de Anomalias em Python

Ver curso

Instruções do exercício

  • Importe o estimador IForest do pyod.
  • Inicialize um IForest() com os parâmetros padrão.
  • Ajuste o estimador e gere previsões em big_mart simultaneamente, armazenando os resultados em labels.
  • Use subsetting do pandas para filtrar os outliers de big_mart.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import IForest from pyod
from pyod.____ import ____

# Initialize an instance with default parameters
iforest = ____

# Generate outlier labels
labels = ____

# Filter big_mart for outliers
outliers = ____

print(outliers.shape)
Editar e executar o código