KNN con probabilità di outlier
Dato che non possiamo fidarci del tutto dell'output quando usiamo contamination, verifichiamo il lavoro con le probabilità di outlier. Sono più affidabili.
Il set di dati è stato caricato come females ed è stato importato anche l'estimatore KNN.
Questo esercizio fa parte del corso
Rilevamento delle anomalie in Python
Istruzioni dell'esercizio
- Istanzia
KNNcon 20 vicini. - Calcola le probabilità di outlier.
- Crea una maschera booleana che restituisca valori true quando la probabilità di outlier supera il 55%.
- Usa
is_outlierper filtrare gli outlier dafemales.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Instantiate a KNN with 20 neighbors and fit to `females`
knn = ____
knn.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))