n_estimators auswählen
n_estimators ist der Parameter, der die Modellleistung am stärksten beeinflusst. Wenn du IForest mit genügend Bäumen erstellst, hat der Algorithmus genug Generalisierungskraft, um Ausreißer von normalen Datenpunkten zu isolieren. Die optimale Anzahl an Bäumen hängt von der Datensatzgröße ab; Werte, die zu hoch oder zu niedrig sind, führen zu ungenauen Vorhersagen.
Übe das Setzen von n_estimators am big_mart-Datensatz. Er wurde zusammen mit IForest aus pyod bereits für dich geladen.
Diese Übung ist Teil des Kurses
<Kurs>Anomalieerkennung mit Python</Kurs>Übungsanweisungen
- Erstelle einen
IForest()-Estimator mit 300 iTrees. - Fitte die Instanz auf
big_mart.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create an IForest with 300 trees
iforest = ____
# Fit to the Big Mart sales data
____