Detectando outliers com IForest
O IForest é um estimador robusto e precisa de poucas linhas de código para detectar outliers em qualquer conjunto de dados. Essa sintaxe pode parecer familiar, pois se parece muito com a do sklearn.
A versão completa dos dados de vendas da Big Mart foi carregada para você como big_mart, que você pode explorar no console.
Este exercício faz parte do curso
Detecção de Anomalias em Python
Instruções do exercício
- Importe o estimador
IForestdopyod. - Inicialize um
IForest()com os parâmetros padrão. - Ajuste o estimador e gere previsões em
big_martsimultaneamente, armazenando os resultados emlabels. - Use subsetting do
pandaspara filtrar os outliers debig_mart.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import IForest from pyod
from pyod.____ import ____
# Initialize an instance with default parameters
iforest = ____
# Generate outlier labels
labels = ____
# Filter big_mart for outliers
outliers = ____
print(outliers.shape)