Sequentiële dataset
Goed gedaan met het bouwen van de functie create_sequences()! Tijd om die te gebruiken om een trainingsgegevensset voor je model te maken.
Net als bij tabel- en afbeeldingsdata geef je sequentiële data het makkelijkst door aan een model via een torch Dataset en DataLoader. Om een sequentiële Dataset te bouwen, roep je create_sequences() aan om de NumPy-arrays met inputs en targets te krijgen, en bekijk je hun vorm. Daarna geef je ze door aan een TensorDataset om een echte torch Dataset te maken, en controleer je de lengte daarvan.
Jouw implementatie van create_sequences() en een DataFrame met de trainingsdata, train_data, zijn beschikbaar.
Deze oefening maakt deel uit van de cursus
Gevorderde Deep Learning met PyTorch
Oefeninstructies
- Roep
create_sequences()aan met de trainings-DataFrame en een sequencelengte van24*4, en ken het resultaat toe aanX_train, y_train. - Definieer
dataset_traindoorTensorDatasetaan te roepen en er twee argumenten aan door te geven: de inputs en de targets die doorcreate_sequences()zijn gemaakt, beide geconverteerd van NumPy-arrays naar tensors van floats.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
import torch
from torch.utils.data import TensorDataset
# Use create_sequences to create inputs and targets
X_train, y_train = ____
print(X_train.shape, y_train.shape)
# Create TensorDataset
dataset_train = ____(
____,
____,
)
print(len(dataset_train))