Variabilität der Modellbewertung über die Zeit visualisieren

Nachdem du die Variabilität der einzelnen Koeffizienten bewertet hast, machen wir das Gleiche für die Leistung (Scores) des Modells. Denk daran: Das TimeSeriesSplit-Objekt verwendet für jedes Test-Set sukzessive spätere Indizes. Das bedeutet, du kannst die Scores deiner Validierung als Zeitreihe behandeln. Du kannst sie über die Zeit visualisieren, um zu sehen, wie sich die Modellleistung verändert.

Eine Instanz des linearen Regressionsmodells ist in model gespeichert, ein Cross-Validation-Objekt in cv, und die Daten in X und y.

Diese Übung ist Teil des Kurses

Maschinelles Lernen für Zeitreihendaten in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

from sklearn.model_selection import cross_val_score

# Generate scores for each split to see how the model performs over time
scores = cross_val_score(model, X, y, cv=cv, scoring=my_pearsonr)

# Convert to a Pandas Series object
scores_series = pd.Series(scores, index=times_scores, name='score')

# Bootstrap a rolling confidence interval for the mean score
scores_lo = scores_series.____(20).aggregate(partial(____, percentiles=2.5))
scores_hi = scores_series.____(20).aggregate(partial(____, percentiles=97.5))

Code bearbeiten und ausführen