Ausreißerwahrscheinlichkeiten verwenden
Eine Alternative zum Isolieren von Ausreißern mit contamination ist die Verwendung von Ausreißerwahrscheinlichkeiten. Das Beste an dieser Methode: Du kannst einen beliebigen Wahrscheinlichkeitsschwellenwert wählen – so kannst du dir bei den Vorhersagen genau so sicher sein, wie du möchtest.
IForest und big_mart sind bereits geladen.
Diese Übung ist Teil des Kurses
<Kurs>Anomalieerkennung mit Python</Kurs>Übungsanweisungen
- Berechne die Wahrscheinlichkeiten für Inlier und Ausreißer.
- Extrahiere die Wahrscheinlichkeiten für Ausreißer in
outlier_probs. - Filtere die Ausreißer in
outliers, indem du einen Schwellenwert von 70 % aufoutlier_probsanwendest.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
iforest = IForest(random_state=10).fit(big_mart)
# Calculate probabilities
probs = iforest.____
# Extract the probabilities for outliers
outlier_probs = ____[____]
# Filter for when the probability is higher than 70%
outliers = ____[____]
print(len(outliers))