Zeitbasierte Cross-Validation
Zum Schluss visualisieren wir das Verhalten des Time-Series-Cross-Validation-Iterators in scikit-learn. Verwende dieses Objekt, um ein letztes Mal durch deine Daten zu iterieren und dabei die Trainingsdaten zu visualisieren, die in jeder Iteration zum Fitten des Modells verwendet werden.
Eine Instanz des linearen Regressions-model-Objekts steht dir in deinem Workspace zur Verfügung. Außerdem sind die Arrays X und y (Trainingsdaten) ebenfalls vorhanden.
Diese Übung ist Teil des Kurses
Maschinelles Lernen für Zeitreihendaten in Python
Anleitung zur Übung
- Importiere
TimeSeriesSplitaussklearn.model_selection. - Erzeuge einen Time-Series-Cross-Validation-Iterator mit 10 Splits.
- Iteriere über die CV-Splits. Visualisiere in jeder Iteration die Werte der Eingabedaten, die zum Trainieren des Modells in dieser Iteration verwendet würden.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import TimeSeriesSplit
____
# Create time-series cross-validation object
cv = ____
# Iterate through CV splits
fig, ax = plt.subplots()
for ii, (tr, tt) in enumerate(cv.split(X, y)):
# Plot the training data on each iteration, to see the behavior of the CV
ax.plot(tr, ii + y[tr])
ax.set(title='Training data on each CV iteration', ylabel='CV iteration')
plt.show()