Conjunto de datos de dos entradas
La construcción de un modelo multientrada comienza con la elaboración de un conjunto de datos personalizado que pueda suministrar todas las entradas al modelo. En este ejercicio, vas a construir el conjunto de datos Omniglot que sirve tripletas formadas por:
- La imagen de un personaje que hay que clasificar.
- El vector del alfabeto codificado en un punto de longitud 30, con ceros en todas partes excepto en un único uno que denota la ID del alfabeto de donde procede el carácter.
- La etiqueta de destino, un número entero entre 0 y 963.
Se te proporciona samples
, una lista de 3 tuplas que contiene la ruta del archivo de una imagen, su vector alfabético y la etiqueta de destino. Además, las siguientes importaciones ya se han hecho por ti, así que ¡manos a la obra!
from PIL import Image
from torch.utils.data import DataLoader, Dataset
from torchvision import transforms
Este ejercicio forma parte del curso
Aprendizaje profundo intermedio con PyTorch
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
class OmniglotDataset(Dataset):
def __init__(self, transform, samples):
# Assign transform and samples to class attributes
____ = ____
____ = ____