Zeitbasierte Cross-Validation

Zum Schluss visualisieren wir das Verhalten des Time-Series-Cross-Validation-Iterators in scikit-learn. Verwende dieses Objekt, um ein letztes Mal durch deine Daten zu iterieren und dabei die Trainingsdaten zu visualisieren, die in jeder Iteration zum Fitten des Modells verwendet werden.

Eine Instanz des linearen Regressions-model-Objekts steht dir in deinem Workspace zur Verfügung. Außerdem sind die Arrays X und y (Trainingsdaten) ebenfalls vorhanden.

Diese Übung ist Teil des Kurses

Maschinelles Lernen für Zeitreihendaten in Python

Kurs anzeigen

Anleitung zur Übung

Importiere TimeSeriesSplit aus sklearn.model_selection.
Erzeuge einen Time-Series-Cross-Validation-Iterator mit 10 Splits.
Iteriere über die CV-Splits. Visualisiere in jeder Iteration die Werte der Eingabedaten, die zum Trainieren des Modells in dieser Iteration verwendet würden.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import TimeSeriesSplit
____

# Create time-series cross-validation object
cv = ____

# Iterate through CV splits
fig, ax = plt.subplots()
for ii, (tr, tt) in enumerate(cv.split(X, y)):
    # Plot the training data on each iteration, to see the behavior of the CV
    ax.plot(tr, ii + y[tr])

ax.set(title='Training data on each CV iteration', ylabel='CV iteration')
plt.show()

Code bearbeiten und ausführen