Variabilität der Modellbewertung über die Zeit visualisieren
Nachdem du die Variabilität der einzelnen Koeffizienten bewertet hast, machen wir das Gleiche für die Leistung (Scores) des Modells. Denk daran: Das TimeSeriesSplit-Objekt verwendet für jedes Test-Set sukzessive spätere Indizes. Das bedeutet, du kannst die Scores deiner Validierung als Zeitreihe behandeln. Du kannst sie über die Zeit visualisieren, um zu sehen, wie sich die Modellleistung verändert.
Eine Instanz des linearen Regressionsmodells ist in model gespeichert, ein Cross-Validation-Objekt in cv, und die Daten in X und y.
Diese Übung ist Teil des Kurses
Maschinelles Lernen für Zeitreihendaten in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
from sklearn.model_selection import cross_val_score
# Generate scores for each split to see how the model performs over time
scores = cross_val_score(model, X, y, cv=cv, scoring=my_pearsonr)
# Convert to a Pandas Series object
scores_series = pd.Series(scores, index=times_scores, name='score')
# Bootstrap a rolling confidence interval for the mean score
scores_lo = scores_series.____(20).aggregate(partial(____, percentiles=2.5))
scores_hi = scores_series.____(20).aggregate(partial(____, percentiles=97.5))