CommencerCommencer gratuitement

Créer des variables décalées dans le temps

En Machine Learning pour les séries temporelles, il est courant d’utiliser les informations des points de temps précédents pour prédire un point ultérieur.

Dans cet exercice, vous allez « décaler » vos données brutes et visualiser les résultats. Vous utiliserez la série temporelle de variation en pourcentage que vous avez calculée au chapitre précédent, cette fois avec une fenêtre très courte. Une fenêtre courte est importante car, en situation réelle, vous souhaitez prédire les fluctuations quotidiennes d’une série temporelle, et non son évolution sur une période plus longue.

Cet exercice fait partie du cours

Machine Learning for Time Series Data in Python

Afficher le cours

Instructions

  • Utilisez une compréhension de dictionnaire pour créer plusieurs versions décalées de prices_perc en utilisant les retards spécifiés dans shifts.
  • Convertissez le résultat en DataFrame.
  • Utilisez le code fourni pour visualiser les résultats.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# These are the "time lags"
shifts = np.arange(1, 11).astype(int)

# Use a dictionary comprehension to create name: value pairs, one pair per shift
shifted_data = {"lag_{}_day".format(day_shift): prices_perc.____(____) for day_shift in shifts}

# Convert into a DataFrame for subsequent use
prices_perc_shifted = ____(shifted_data)

# Plot the first 100 samples of each
ax = prices_perc_shifted.iloc[:100].plot(cmap=plt.cm.viridis)
prices_perc.iloc[:100].plot(color='r', lw=2)
ax.legend(loc='best')
plt.show()
Modifier et exécuter le code