Detectando outliers com IForest
O IForest é um estimador robusto e precisa de poucas linhas de código para detectar outliers em qualquer conjunto de dados. Essa sintaxe pode parecer familiar, pois se parece muito com a do sklearn.
A versão completa dos dados de vendas da Big Mart foi carregada para você como big_mart, que você pode explorar no console.
Este exercicio faz parte do curso
Detecção de Anomalias em Python
Instruções do exercicio
- Importe o estimador
IForestdopyod. - Inicialize um
IForest()com os parâmetros padrão. - Ajuste o estimador e gere previsões em
big_martsimultaneamente, armazenando os resultados emlabels. - Use subsetting do
pandaspara filtrar os outliers debig_mart.
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Import IForest from pyod
from pyod.____ import ____
# Initialize an instance with default parameters
iforest = ____
# Generate outlier labels
labels = ____
# Filter big_mart for outliers
outliers = ____
print(outliers.shape)