LOF avec probabilités d’anomalie
Comme toujours, vérifiez que le niveau de contamination choisi est pertinent en filtrant les anomalies avec un seuil de probabilité. La syntaxe est la même qu’avec KNN.
L’estimateur LOF a déjà été importé et le jeu de données females_transformed est également disponible.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Instanciez
LOF()avec 20 voisins. - Calculez les probabilités d’anomalie dans
probs. - Créez un masque booléen nommé
is_outlierqui renvoieTruelorsque la probabilité d’anomalie est supérieure à 50 %. - Utilisez
is_outlierpour filtrer les anomalies defemales_transformed.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Instantiate an LOF with 20 neighbors and fit to the data
lof = ____
lof.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))