Ensemble de données à deux entrées
La construction d'un modèle à entrées multiples commence par l'élaboration d'un ensemble de données personnalisé qui peut fournir toutes les entrées du modèle. Dans cet exercice, vous construirez l'ensemble de données Omniglot qui contient des triplets composés de
- L'image d'un personnage à classer,
- Vecteur de l'alphabet codé à une touche, de longueur 30, avec des zéros partout sauf un seul qui représente le ID de l'alphabet d'où provient le caractère,
- L'étiquette cible, un nombre entier entre 0 et 963.
Vous disposez de samples
, une liste de 3 tuples comprenant le chemin d'accès au fichier d'une image, son vecteur alphabétique et l'étiquette cible. De plus, les importations suivantes ont déjà été effectuées pour vous, alors passons à l'action !
from PIL import Image
from torch.utils.data import DataLoader, Dataset
from torchvision import transforms
Cet exercice fait partie du cours
Apprentissage profond intermédiaire avec PyTorch
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
class OmniglotDataset(Dataset):
def __init__(self, transform, samples):
# Assign transform and samples to class attributes
____ = ____
____ = ____