CommencerCommencer gratuitement

Jeu de données à deux entrées

La création d’un modèle à entrées multiples commence par la conception d’un jeu de données personnalisé capable de fournir toutes les entrées au modèle. Dans cet exercice, vous allez construire le jeu de données Omniglot qui renvoie des triplets composés de :

  • L’image d’un caractère à classer,
  • Le vecteur d’alphabet encodé en one-hot de longueur 30, avec des zéros partout sauf un seul 1 indiquant l’ID de l’alphabet d’où provient le caractère,
  • Le label cible, un entier entre 0 et 963.

On vous fournit samples, une liste de 3‑uplets contenant le chemin du fichier image, son vecteur d’alphabet et le label cible. De plus, les imports suivants ont déjà été effectués pour vous, alors allons‑y !

from PIL import Image
from torch.utils.data import DataLoader, Dataset
from torchvision import transforms

Cet exercice fait partie du cours

Deep learning intermédiaire avec PyTorch

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

class OmniglotDataset(Dataset):
    def __init__(self, transform, samples):
        # Assign transform and samples to class attributes
        ____ = ____
        ____ = ____
Modifier et exécuter le code