LoslegenKostenlos starten

Variabilität der Modellbewertung über die Zeit visualisieren

Nachdem du die Variabilität der einzelnen Koeffizienten bewertet hast, machen wir das Gleiche für die Leistung (Scores) des Modells. Denk daran: Das TimeSeriesSplit-Objekt verwendet für jedes Test-Set sukzessive spätere Indizes. Das bedeutet, du kannst die Scores deiner Validierung als Zeitreihe behandeln. Du kannst sie über die Zeit visualisieren, um zu sehen, wie sich die Modellleistung verändert.

Eine Instanz des linearen Regressionsmodells ist in model gespeichert, ein Cross-Validation-Objekt in cv, und die Daten in X und y.

Diese Übung ist Teil des Kurses

<Kurs>Maschinelles Lernen für Zeitreihendaten in Python</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

from sklearn.model_selection import cross_val_score

# Generate scores for each split to see how the model performs over time
scores = cross_val_score(model, X, y, cv=cv, scoring=my_pearsonr)

# Convert to a Pandas Series object
scores_series = pd.Series(scores, index=times_scores, name='score')

# Bootstrap a rolling confidence interval for the mean score
scores_lo = scores_series.____(20).aggregate(partial(____, percentiles=2.5))
scores_hi = scores_series.____(20).aggregate(partial(____, percentiles=97.5))
Code bearbeiten und ausführen