VQA de documents avec LayoutLM
De la VQA avec images à la VQA avec documents ! Dans cet exercice, vous utiliserez le modèle de calcul des heures de formation ( layoutlm-document-qa
) pour déterminer le nombre total d'heures de formation dispensées aux employés au cours des années 2012-2013 à partir de l'image du document ci-dessous :
L'ensemble de données (dataset
) a été chargé et le module pipeline (pipeline
) a été importé.
Cet exercice fait partie du cours
Modèles multimodaux avec Hugging Face
Instructions
- Chargez le pipeline à l'aide de la tâche «
'document-question-answering'
» (Charger le pipeline) et du point de contrôle «'impira/layoutlm-document-qa'
» (Point de contrôle du pipeline - Traitez le document dans l'
61
des données de l'ensemble de donnéestest
disponible à l'adressedataset
avec une invite appropriée pour déterminer combien de jours de formation officielle ont été dispensés aux employés en 2012-2013.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the document-question-answering pipeline with the pretrained model
pipe = ____
# Process datapoint 61 to find the amount of training days
result = ____(dataset["____"][61]["____"], "____")
print(result)