CommencerCommencer gratuitement

Ensemble de données à deux entrées

La construction d'un modèle à entrées multiples commence par l'élaboration d'un ensemble de données personnalisé qui peut fournir toutes les entrées du modèle. Dans cet exercice, vous construirez l'ensemble de données Omniglot qui contient des triplets composés de

  • L'image d'un personnage à classer,
  • Vecteur de l'alphabet codé à une touche, de longueur 30, avec des zéros partout sauf un seul qui représente le ID de l'alphabet d'où provient le caractère,
  • L'étiquette cible, un nombre entier entre 0 et 963.

Vous disposez de samples, une liste de 3 tuples comprenant le chemin d'accès au fichier d'une image, son vecteur alphabétique et l'étiquette cible. De plus, les importations suivantes ont déjà été effectuées pour vous, alors passons à l'action !

from PIL import Image
from torch.utils.data import DataLoader, Dataset
from torchvision import transforms

Cet exercice fait partie du cours

Apprentissage profond intermédiaire avec PyTorch

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

class OmniglotDataset(Dataset):
    def __init__(self, transform, samples):
        # Assign transform and samples to class attributes
        ____ = ____
        ____ = ____
Modifier et exécuter le code