ComeçarComece de graça

LOF com probabilidades de outlier

Como sempre, confira se o nível de contaminação escolhido é confiável filtrando os outliers com um limiar de probabilidade. A sintaxe é a mesma de KNN.

O estimador LOF já foi importado e o conjunto de dados females_transformed também está disponível.

Este exercício faz parte do curso

Detecção de Anomalias em Python

Ver curso

Instruções do exercício

  • Instancie LOF() com 20 vizinhos.
  • Calcule as probabilidades de outlier em probs.
  • Crie uma máscara booleana chamada is_outlier que retorne valores verdadeiros quando a probabilidade de outlier for maior que 50%.
  • Use is_outlier para filtrar os outliers de females_transformed.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Instantiate an LOF with 20 neighbors and fit to the data
lof = ____
lof.____

# Calculate probabilities
probs = ____

# Create a boolean mask
is_outlier = ____

# Use the boolean mask to filter the outliers
outliers = ____

print(len(outliers))
Editar e executar o código