LOF com probabilidades de outlier
Como sempre, confira se o nível de contaminação escolhido é confiável filtrando os outliers com um limiar de probabilidade. A sintaxe é a mesma de KNN.
O estimador LOF já foi importado e o conjunto de dados females_transformed também está disponível.
Este exercício faz parte do curso
Detecção de Anomalias em Python
Instruções do exercício
- Instancie
LOF()com 20 vizinhos. - Calcule as probabilidades de outlier em
probs. - Crie uma máscara booleana chamada
is_outlierque retorne valores verdadeiros quando a probabilidade de outlier for maior que 50%. - Use
is_outlierpara filtrar os outliers defemales_transformed.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Instantiate an LOF with 20 neighbors and fit to the data
lof = ____
lof.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))