Jeu de données à deux entrées
La création d’un modèle à entrées multiples commence par la conception d’un jeu de données personnalisé capable de fournir toutes les entrées au modèle. Dans cet exercice, vous allez construire le jeu de données Omniglot qui renvoie des triplets composés de :
- L’image d’un caractère à classer,
- Le vecteur d’alphabet encodé en one-hot de longueur 30, avec des zéros partout sauf un seul 1 indiquant l’ID de l’alphabet d’où provient le caractère,
- Le label cible, un entier entre 0 et 963.
On vous fournit samples, une liste de 3‑uplets contenant le chemin du fichier image, son vecteur d’alphabet et le label cible. De plus, les imports suivants ont déjà été effectués pour vous, alors allons‑y !
from PIL import Image
from torch.utils.data import DataLoader, Dataset
from torchvision import transforms
Cet exercice fait partie du cours
Deep learning intermédiaire avec PyTorch
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
class OmniglotDataset(Dataset):
def __init__(self, transform, samples):
# Assign transform and samples to class attributes
____ = ____
____ = ____