CommencerCommencer gratuitement

Ensemble de données séquentielles

Bon travail de construction de la fonction create_sequences()! Il est temps de l'utiliser pour créer un ensemble de données d'entraînement pour votre modèle.

Tout comme les données tabulaires et les images, les données séquentielles sont plus facilement transmises à un modèle par l'intermédiaire d'un Dataset et d'un DataLoader de Torch. Pour construire un Dataset séquentiel, vous appellerez create_sequences() pour obtenir les tableaux NumPy avec les entrées et les cibles, et inspecter leur forme. Ensuite, vous les transmettrez à un site TensorDataset pour créer un jeu de données de torche approprié et inspecter sa longueur.

Votre implémentation de create_sequences() et un DataFrame contenant les données d'apprentissage appelé train_data sont disponibles.

Cet exercice fait partie du cours

Deep learning intermédiaire avec PyTorch

Afficher le cours

Instructions

  • Appelez create_sequences(), en lui transmettant le DataFrame d'apprentissage et une longueur de séquence de 24*4, en affectant le résultat à X_train, y_train.
  • Définissez dataset_train en appelant TensorDataset et en lui passant deux arguments, les entrées et les cibles créées par create_sequences(), toutes deux converties de tableaux NumPy en tenseurs de flottants.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

import torch
from torch.utils.data import TensorDataset

# Use create_sequences to create inputs and targets
X_train, y_train = ____
print(X_train.shape, y_train.shape)

# Create TensorDataset
dataset_train = ____(
    ____,
    ____,
)
print(len(dataset_train))
Modifier et exécuter le code