Schwellenwert und gleitende Durchschnitte berechnen
Du verfolgst die Prognosegenauigkeit im Zeitverlauf, um Modelldrift zu erkennen. Durch die Berechnung gleitender Fenster und die Definition eines Schwellenwerts zum Auslösen von Drift-Warnungen kannst du feststellen, wann das Modell nicht mehr zur Realität passt und ein Retraining benötigt.
Du verwendest die ersten 14 Prognosen aus fc_log_test, um den Schwellenwert festzulegen, und wendest ihn anschließend auf die restlichen Prognoseprotokolle an. Die Prognoseprotokolle fc_log_test und fc_log mit den Modellleistungswerten wurden zusammen mit pandas als pd vorab geladen.
Diese Übung ist Teil des Kurses
Forecasting-Pipelines für die Produktion entwerfen
Anleitung zur Übung
- Definiere den Schwellenwert aus
fc_log_test, indem du zur RMSE-Mittelwert drei Standardabweichungen addierst, und speichere ihn alsrmse_threshold. - Berechne den gleitenden Durchschnitt der RMSE mit 7- und 14-Tage-Fenstern für
fc_log.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set threshold: mean + 3 standard deviations
rmse_threshold = fc_log_test["____"].mean() + 3 * fc_log_test["____"].____()
# Create rolling window averages for RMSE
fc_log["rmse_ma_7"] = fc_log["rmse"].rolling(window=____).____()
fc_log["rmse_ma_14"] = fc_log["rmse"].rolling(window=____).____()
print(f"RMSE threshold: {round(rmse_threshold, 2)}")
print()
print("Forecast log with rolling averages:")
print(fc_log[["forecast_start", "rmse", "rmse_ma_7", "rmse_ma_14"]].head(20))