Conjunto de dados sequenciais
Bom trabalho ao criar a função create_sequences()
! É hora de usá-lo para criar um conjunto de dados de treinamento para o seu modelo.
Assim como os dados tabulares e de imagem, os dados sequenciais são mais facilmente transmitidos a um modelo por meio de um conjunto de dados e DataLoader de tocha. Para criar um conjunto de dados sequencial, você chamará create_sequences()
para obter as matrizes NumPy com entradas e alvos e inspecionar sua forma. Em seguida, você os passará para um TensorDataset
para criar um conjunto de dados torch adequado e inspecionar seu comprimento.
Sua implementação de create_sequences()
e um DataFrame com os dados de treinamento chamado train_data
estão disponíveis.
Este exercício faz parte do curso
Aprendizagem profunda intermediária com PyTorch
Instruções do exercício
- Chame
create_sequences()
, passando a ele o DataFrame de treinamento e um comprimento de sequência de24*4
, atribuindo o resultado aX_train, y_train
. - Defina
dataset_train
chamandoTensorDataset
e passando a ele dois argumentos, as entradas e os alvos criados porcreate_sequences()
, ambos convertidos de matrizes NumPy para tensores de floats.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
import torch
from torch.utils.data import TensorDataset
# Use create_sequences to create inputs and targets
X_train, y_train = ____
print(X_train.shape, y_train.shape)
# Create TensorDataset
dataset_train = ____(
____,
____,
)
print(len(dataset_train))