Jeu de données séquentiel
Bravo pour la fonction create_sequences() ! Il est temps de l’utiliser pour créer un jeu de données d’entraînement pour votre modèle.
Comme pour les données tabulaires et d’images, le plus simple pour alimenter un modèle avec des données séquentielles est de passer par un Dataset et un DataLoader de torch. Pour construire un Dataset séquentiel, vous appellerez create_sequences() afin d’obtenir les tableaux NumPy des entrées et des cibles, puis vous examinerez leur forme. Ensuite, vous les passerez à un TensorDataset pour créer un Dataset torch approprié et vous en inspecterez la longueur.
Votre implémentation de create_sequences() et un DataFrame contenant les données d’entraînement nommé train_data sont disponibles.
Cet exercice fait partie du cours
Deep learning intermédiaire avec PyTorch
Instructions
- Appelez
create_sequences()en lui passant le DataFrame d’entraînement et une longueur de séquence de24*4, et affectez le résultat àX_train, y_train. - Définissez
dataset_trainen appelantTensorDatasetet en lui passant deux arguments, les entrées et les cibles créées parcreate_sequences(), toutes deux converties de tableaux NumPy en tenseurs de flottants.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
import torch
from torch.utils.data import TensorDataset
# Use create_sequences to create inputs and targets
X_train, y_train = ____
print(X_train.shape, y_train.shape)
# Create TensorDataset
dataset_train = ____(
____,
____,
)
print(len(dataset_train))