CommencerCommencer gratuitement

VQA de documents avec LayoutLM

De la VQA avec images à la VQA avec documents ! Dans cet exercice, vous utiliserez le modèle de calcul des heures de formation ( layoutlm-document-qa ) pour déterminer le nombre total d'heures de formation dispensées aux employés au cours des années 2012-2013 à partir de l'image du document ci-dessous :

Lettre d'information d'une entreprise spécialisée dans les technologies de l'information et de la communication

L'ensemble de données (dataset) a été chargé et le module pipeline (pipeline) a été importé.

Cet exercice fait partie du cours

Modèles multimodaux avec Hugging Face

Afficher le cours

Instructions

  • Chargez le pipeline à l'aide de la tâche « 'document-question-answering' » (Charger le pipeline) et du point de contrôle « 'impira/layoutlm-document-qa' » (Point de contrôle du pipeline
  • Traitez le document dans l'61 des données de l'ensemble de données test disponible à l'adresse dataset avec une invite appropriée pour déterminer combien de jours de formation officielle ont été dispensés aux employés en 2012-2013.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load the document-question-answering pipeline with the pretrained model
pipe = ____

# Process datapoint 61 to find the amount of training days
result = ____(dataset["____"][61]["____"], "____")

print(result)
Modifier et exécuter le code