n_estimators auswählen
n_estimators ist der Parameter, der die Modellleistung am stärksten beeinflusst. Wenn du IForest mit genügend Bäumen erstellst, hat der Algorithmus genug Generalisierungskraft, um Ausreißer von normalen Datenpunkten zu isolieren. Die optimale Anzahl an Bäumen hängt von der Datensatzgröße ab; Werte, die zu hoch oder zu niedrig sind, führen zu ungenauen Vorhersagen.
Übe das Setzen von n_estimators am big_mart-Datensatz. Er wurde zusammen mit IForest aus pyod bereits für dich geladen.
Diese Übung ist Teil des Kurses
Anomalieerkennung mit Python
Anleitung zur Übung
- Erstelle einen
IForest()-Estimator mit 300 iTrees. - Fitte die Instanz auf
big_mart.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create an IForest with 300 trees
iforest = ____
# Fit to the Big Mart sales data
____