ComeçarComece de graça

Usando probabilidades de outlier

Uma alternativa a isolar outliers com contamination é usar probabilidades de outlier. A melhor parte desse método é que você pode escolher um limiar de probabilidade arbitrário, o que significa que pode definir o nível de confiança que quiser nas previsões.

IForest e big_mart já estão carregados.

Este exercício faz parte do curso

Detecção de Anomalias em Python

Ver curso

Instruções do exercício

  • Calcule as probabilidades para inliers e outliers.
  • Extraia as probabilidades de outliers em outlier_probs.
  • Filtre os outliers em outliers usando um limiar de 70% em outlier_probs.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

iforest = IForest(random_state=10).fit(big_mart)

# Calculate probabilities
probs = iforest.____

# Extract the probabilities for outliers
outlier_probs = ____[____]

# Filter for when the probability is higher than 70%
outliers = ____[____]

print(len(outliers))
Editar e executar o código