Ausreißerwahrscheinlichkeiten verwenden
Eine Alternative zum Isolieren von Ausreißern mit contamination ist die Verwendung von Ausreißerwahrscheinlichkeiten. Das Beste an dieser Methode: Du kannst einen beliebigen Wahrscheinlichkeitsschwellenwert wählen – so kannst du dir bei den Vorhersagen genau so sicher sein, wie du möchtest.
IForest und big_mart sind bereits geladen.
Diese Übung ist Teil des Kurses
Anomalieerkennung mit Python
Anleitung zur Übung
- Berechne die Wahrscheinlichkeiten für Inlier und Ausreißer.
- Extrahiere die Wahrscheinlichkeiten für Ausreißer in
outlier_probs. - Filtere die Ausreißer in
outliers, indem du einen Schwellenwert von 70 % aufoutlier_probsanwendest.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
iforest = IForest(random_state=10).fit(big_mart)
# Calculate probabilities
probs = iforest.____
# Extract the probabilities for outliers
outlier_probs = ____[____]
# Filter for when the probability is higher than 70%
outliers = ____[____]
print(len(outliers))