VQA sur document avec LayoutLM
Du VQA sur images au VQA sur documents ! Dans cet exercice, vous allez utiliser le modèle layoutlm-document-qa pour déterminer le nombre total d’heures de formation dispensées aux employé·e·s en 2012-2013 à partir de cette image de document :

Le jeu de données (dataset) a été chargé et le module de pipeline (pipeline) a été importé.
Cet exercice fait partie du cours
Modèles multimodaux avec Hugging Face
Instructions
- Chargez la pipeline avec la tâche
'document-question-answering'et le point de contrôle'impira/layoutlm-document-qa'. - Traitez le document au point de données
61de l’ensembletestdansdatasetavec une invite adaptée pour trouver combien de jours de formation formelle ont été fournis aux employé·e·s en 2012-2013.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the document-question-answering pipeline with the pretrained model
pipe = ____
# Process datapoint 61 to find the amount of training days
result = ____(dataset["____"][61]["____"], "____")
print(result)