CommencerCommencer gratuitement

Évaluation automatique de la qualité d’une légende

Vous avez correctement classé l’image de la robe, mais la description d’origine est-elle de bonne qualité ?

Maa Fab wrap with a Trendy design dress with Vibrant color for an elegant touch of Fabric completely Soft and Comfortable wear with amazing design of Solid Boat ? Neck Flared Dress to make a perfect addition to your wardrobe collection.

Vous allez maintenant utiliser le modèle CLIP pour formuler une évaluation quantitative de l’exactitude de cette description à l’aide du CLIP score. La légende (description), l’image (image), la classe ToTensor et la fonction clip_score() de torchmetrics ont été chargées.

Cet exercice fait partie du cours

Modèles multimodaux avec Hugging Face

Afficher le cours

Instructions

  • Convertissez l’image en tenseur PyTorch avec des intensités comprises entre 0 et 255.
  • Utilisez la fonction clip_score() pour évaluer la qualité de la légende en comparant image et description avec le modèle openai/clip-vit-base-patch32.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Convert the image to a PyTorch tensor
image = ____()(image)*____

# Use the clip_score function to assess the quality of the caption
score = ____(____, ____, "____")

print(f"CLIP score: {score}")
Modifier et exécuter le code