Évaluation automatique de la qualité d’une légende
Vous avez correctement classé l’image de la robe, mais la description d’origine est-elle de bonne qualité ?
Maa Fab wrap with a Trendy design dress with Vibrant color for an elegant touch of Fabric completely Soft and Comfortable wear with amazing design of Solid Boat ? Neck Flared Dress to make a perfect addition to your wardrobe collection.
Vous allez maintenant utiliser le modèle CLIP pour formuler une évaluation quantitative de l’exactitude de cette description à l’aide du CLIP score. La légende (description), l’image (image), la classe ToTensor et la fonction clip_score() de torchmetrics ont été chargées.
Cet exercice fait partie du cours
Modèles multimodaux avec Hugging Face
Instructions
- Convertissez l’image en tenseur PyTorch avec des intensités comprises entre 0 et 255.
- Utilisez la fonction
clip_score()pour évaluer la qualité de la légende en comparantimageetdescriptionavec le modèleopenai/clip-vit-base-patch32.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Convert the image to a PyTorch tensor
image = ____()(image)*____
# Use the clip_score function to assess the quality of the caption
score = ____(____, ____, "____")
print(f"CLIP score: {score}")