Jeu de données d’images
Commençons par construire un Dataset Torch d’images. Vous l’utiliserez pour explorer les données et, plus tard, pour l’alimenter dans un modèle.
Les données d’entraînement pour la tâche de classification des nuages sont stockées avec la structure de répertoires suivante :
clouds_train
- cirriform clouds
- 539cd1c356e9c14749988a12fdf6c515.jpg
- ...
- clear sky
- cumulonimbus clouds
- cumulus clouds
- high cumuliform clouds
- stratiform clouds
- stratocumulus clouds
Il y a sept dossiers dans clouds_train, chacun représentant un type de nuage (ou un ciel dégagé). À l’intérieur de chaque dossier se trouvent les fichiers image correspondants.
Les importations suivantes ont déjà été effectuées pour vous :
from torchvision.datasets import ImageFolder
from torchvision import transforms
Cet exercice fait partie du cours
Deep learning intermédiaire avec PyTorch
Instructions
- Composez deux transformations : la première pour convertir l’image en tenseur, et la seconde pour redimensionner l’image en
128par128, et affectez-les àtrain_transforms. - Utilisez
ImageFolderpour définirdataset_train, en lui passant le chemin du répertoire des données ("clouds_train") et les transformations définies précédemment.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compose transformations
train_transforms = ____([
transforms.____,
transforms.____,
])
# Create Dataset using ImageFolder
dataset_train = ____(
____,
transform=____,
)