KNN mit Ausreißerwahrscheinlichkeiten
Da wir dem Ergebnis mit contamination nicht vollständig trauen können, prüfen wir unsere Arbeit noch einmal mit Ausreißerwahrscheinlichkeiten nach. Die sind zuverlässiger.
Der Datensatz wurde als females geladen, und der KNN-Estimator ist ebenfalls importiert.
Diese Übung ist Teil des Kurses
Anomalieerkennung mit Python
Anleitung zur Übung
- Instanziiere
KNNmit 20 Nachbarn. - Berechne die Ausreißerwahrscheinlichkeiten.
- Erstelle eine boolesche Maske, die true liefert, wenn die Ausreißerwahrscheinlichkeit über 55 % liegt.
- Verwende
is_outlier, um die Ausreißer ausfemaleszu filtern.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Instantiate a KNN with 20 neighbors and fit to `females`
knn = ____
knn.____
# Calculate probabilities
probs = ____
# Create a boolean mask
is_outlier = ____
# Use the boolean mask to filter the outliers
outliers = ____
print(len(outliers))