Aan de slagGa gratis aan de slag

Document-VQA met LayoutLM

Van VQA met afbeeldingen naar VQA met documenten! In deze oefening gebruik je het model layoutlm-document-qa om het totale aantal trainingsuren te bepalen dat in de jaren 2012-2013 aan werknemers is gegeven op basis van deze documentafbeelding:

Newsletter from an ICT company

De gegevensset (dataset) is geladen en de pipeline-module (pipeline) is geïmporteerd.

Deze oefening maakt deel uit van de cursus

Multi-modale modellen met Hugging Face

Cursus bekijken

Oefeninstructies

  • Laad de pipeline met de taak 'document-question-answering' en het checkpoint 'impira/layoutlm-document-qa'.
  • Verwerk het document in datapunt 61 van de test-set uit dataset met een passende prompt om te vinden hoeveel dagen formele training aan werknemers zijn gegeven in 2012-2013.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load the document-question-answering pipeline with the pretrained model
pipe = ____

# Process datapoint 61 to find the amount of training days
result = ____(dataset["____"][61]["____"], "____")

print(result)
Code bewerken en uitvoeren