Wahrscheinlichkeiten aggregieren und mit Schwellenwerten arbeiten
Bei Ensembles gibt es viele Möglichkeiten zur Aggregation. Am gebräuchlichsten sind das arithmetische Mittel und der Median.
Das Mittel kannst du fast immer verwenden, während du den Median eher dann nutzt, wenn du mindestens drei Klassifikatoren in deinen estimators hast.
Verwende das arithmetische Mittel, um die Ausreißer im Datensatz apple zu filtern. probability_scores und apple sind aus der vorherigen Übung verfügbar. NumPy ist ebenfalls geladen.
Diese Übung ist Teil des Kurses
Anomalieerkennung mit Python
Anleitung zur Übung
- Ermittle das Mittel von
probability_scoreszeilenweise. - Erzeuge eine boolesche Maske, die True zurückgibt, wenn die Wahrscheinlichkeit über 0.75 liegt.
- Verwende die
is_outlier-Maske, um die Ausreißer zu filtern.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Find the mean across rows
mean_probs = ____
# Create a boolean mask that uses a 75% threshold
is_outlier = ____
# Use the mask to filter outliers from apple
outliers = ____
print(len(outliers))