CommencerCommencer gratuitement

VQA sur document avec LayoutLM

Du VQA sur images au VQA sur documents ! Dans cet exercice, vous allez utiliser le modèle layoutlm-document-qa pour déterminer le nombre total d’heures de formation dispensées aux employé·e·s en 2012-2013 à partir de cette image de document :

Newsletter from an ICT company

Le jeu de données (dataset) a été chargé et le module de pipeline (pipeline) a été importé.

Cet exercice fait partie du cours

Modèles multimodaux avec Hugging Face

Afficher le cours

Instructions

  • Chargez la pipeline avec la tâche 'document-question-answering' et le point de contrôle 'impira/layoutlm-document-qa'.
  • Traitez le document au point de données 61 de l’ensemble test dans dataset avec une invite adaptée pour trouver combien de jours de formation formelle ont été fournis aux employé·e·s en 2012-2013.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load the document-question-answering pipeline with the pretrained model
pipe = ____

# Process datapoint 61 to find the amount of training days
result = ____(dataset["____"][61]["____"], "____")

print(result)
Modifier et exécuter le code