Himpunan Data Sekuensial
Kerja bagus membangun fungsi create_sequences()! Sekarang saatnya menggunakannya untuk membuat himpunan data pelatihan bagi model Anda.
Sama seperti data tabular dan gambar, data sekuensial paling mudah diberikan ke model melalui torch Dataset dan DataLoader. Untuk membangun Dataset sekuensial, Anda akan memanggil create_sequences() untuk mendapatkan array NumPy berisi masukan dan target, lalu memeriksa bentuknya. Selanjutnya, Anda akan meneruskannya ke TensorDataset untuk membuat torch Dataset yang sesuai, dan memeriksa panjangnya.
Implementasi create_sequences() Anda dan sebuah DataFrame berisi data pelatihan bernama train_data tersedia.
Latihan ini adalah bagian dari kursus
Deep Learning Lanjutan dengan PyTorch
Petunjuk latihan
- Panggil
create_sequences(), berikan DataFrame pelatihan dan panjang sekuens24*4, lalu tetapkan hasilnya keX_train, y_train. - Definisikan
dataset_traindengan memanggilTensorDatasetdan meneruskannya dua argumen, yaitu masukan dan target yang dibuat olehcreate_sequences(), keduanya dikonversi dari array NumPy menjadi tensor bertipe float.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
import torch
from torch.utils.data import TensorDataset
# Use create_sequences to create inputs and targets
X_train, y_train = ____
print(X_train.shape, y_train.shape)
# Create TensorDataset
dataset_train = ____(
____,
____,
)
print(len(dataset_train))