Prendre en compte la non-stationnarité
Dans cet exercice, vous allez de nouveau visualiser les variations des scores du modèle, mais cette fois sur des données dont les statistiques évoluent au fil du temps.
Une instance du modèle de régression linéaire est stockée dans model, un objet de validation croisée dans cv, et les données dans X et y.
Cet exercice fait partie du cours
Machine Learning for Time Series Data in Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Pre-initialize window sizes
window_sizes = [25, 50, 75, 100]
# Create an empty DataFrame to collect the stores
all_scores = ____(index=times_scores)
# Generate scores for each split to see how the model performs over time
for window in window_sizes:
# Create cross-validation object using a limited lookback window
cv = ____(n_splits=100, max_train_size=window)
# Calculate scores across all CV splits and collect them in a DataFrame
this_scores = ____(____, ____, ____, cv=cv, scoring=my_pearsonr)
all_scores['Length {}'.format(window)] = this_scores