CommencerCommencer gratuitement

Prendre en compte la non-stationnarité

Dans cet exercice, vous allez de nouveau visualiser les variations des scores du modèle, mais cette fois sur des données dont les statistiques évoluent au fil du temps.

Une instance du modèle de régression linéaire est stockée dans model, un objet de validation croisée dans cv, et les données dans X et y.

Cet exercice fait partie du cours

Machine Learning for Time Series Data in Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Pre-initialize window sizes
window_sizes = [25, 50, 75, 100]

# Create an empty DataFrame to collect the stores
all_scores = ____(index=times_scores)

# Generate scores for each split to see how the model performs over time
for window in window_sizes:
    # Create cross-validation object using a limited lookback window
    cv = ____(n_splits=100, max_train_size=window)
    
    # Calculate scores across all CV splits and collect them in a DataFrame
    this_scores = ____(____, ____, ____, cv=cv, scoring=my_pearsonr)
    all_scores['Length {}'.format(window)] = this_scores
Modifier et exécuter le code