KNN com probabilidades de outlier
Como não podemos confiar totalmente no resultado ao usar contamination, vamos conferir nosso trabalho usando probabilidades de outlier. Elas são mais confiáveis.
O conjunto de dados foi carregado como females e o estimador KNN também foi importado.
Este exercício faz parte do curso
Detecção de Anomalias em Python
Instruções do exercício
- Instancie
KNNcom 20 vizinhos. - Calcule as probabilidades de outlier.
- Crie uma máscara booleana que retorne valores verdadeiros quando a probabilidade de outlier for superior a 55%.
- Use
is_outlierpara filtrar os outliers defemales.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Instantiate a KNN with 20 neighbors and fit to `females`
knn = ____
knn.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))