Ensemble de données séquentielles
Bon travail de construction de la fonction create_sequences()
! Il est temps de l'utiliser pour créer un ensemble de données d'entraînement pour votre modèle.
Tout comme les données tabulaires et les images, les données séquentielles sont plus facilement transmises à un modèle par l'intermédiaire d'un Dataset et d'un DataLoader de Torch. Pour construire un Dataset séquentiel, vous appellerez create_sequences()
pour obtenir les tableaux NumPy avec les entrées et les cibles, et inspecter leur forme. Ensuite, vous les transmettrez à un site TensorDataset
pour créer un jeu de données de torche approprié et inspecter sa longueur.
Votre implémentation de create_sequences()
et un DataFrame contenant les données d'apprentissage appelé train_data
sont disponibles.
Cet exercice fait partie du cours
Deep learning intermédiaire avec PyTorch
Instructions
- Appelez
create_sequences()
, en lui transmettant le DataFrame d'apprentissage et une longueur de séquence de24*4
, en affectant le résultat àX_train, y_train
. - Définissez
dataset_train
en appelantTensorDataset
et en lui passant deux arguments, les entrées et les cibles créées parcreate_sequences()
, toutes deux converties de tableaux NumPy en tenseurs de flottants.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
import torch
from torch.utils.data import TensorDataset
# Use create_sequences to create inputs and targets
X_train, y_train = ____
print(X_train.shape, y_train.shape)
# Create TensorDataset
dataset_train = ____(
____,
____,
)
print(len(dataset_train))