LOF con probabilità di outlier
Come sempre, verifica due volte che il livello di contaminazione scelto sia affidabile filtrando gli outlier con una soglia di probabilità. La sintassi è la stessa di KNN.
L'estimatore LOF è già stato importato ed è disponibile anche l'insieme di dati females_transformed.
Questo esercizio fa parte del corso
Rilevamento delle anomalie in Python
Istruzioni dell'esercizio
- Istanzia
LOF()con 20 vicini. - Calcola le probabilità di outlier in
probs. - Crea una maschera booleana chiamata
is_outlierche restituisca valori veri dove la probabilità di outlier è superiore al 50%. - Usa
is_outlierper filtrare gli outlier dafemales_transformed.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Instantiate an LOF with 20 neighbors and fit to the data
lof = ____
lof.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))