IniziaInizia gratis

VQA su documenti con LayoutLM

Dal VQA su immagini al VQA su documenti! In questo esercizio userai il modello layoutlm-document-qa per determinare il numero totale di ore di formazione erogate ai dipendenti negli anni 2012-2013 partendo da questa immagine del documento:

Newsletter from an ICT company

Il insieme di dati (dataset) è stato caricato e il modulo della pipeline (pipeline) è stato importato.

Questo esercizio fa parte del corso

Modelli multi-modali con Hugging Face

Visualizza il corso

Istruzioni dell'esercizio

  • Carica la pipeline usando il task 'document-question-answering' e il checkpoint 'impira/layoutlm-document-qa'.
  • Elabora il documento al punto dati 61 del set test da dataset con un prompt appropriato per trovare quanti giorni di formazione formale sono stati forniti ai dipendenti nel 2012-2013.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load the document-question-answering pipeline with the pretrained model
pipe = ____

# Process datapoint 61 to find the amount of training days
result = ____(dataset["____"][61]["____"], "____")

print(result)
Modifica ed esegui il codice