1. Apprendre
  2. /
  3. Cours
  4. /
  5. Modele multimodalne z Hugging Face

Connected

Exercice

Document VQA z LayoutLM

Od VQA na obrazach do VQA na dokumentach! W tym ćwiczeniu użyjesz modelu layoutlm-document-qa, aby określić łączną liczbę godzin szkoleń pracowników w latach 2012–2013 na podstawie poniższego obrazu dokumentu:

Newsletter from an ICT company

Zbiór danych (dataset) został wczytany, a moduł pipeline (pipeline) zaimportowany.

Instructions

100 XP
  • Załaduj pipeline, używając zadania 'document-question-answering' i punktu kontrolnego 'impira/layoutlm-document-qa'.
  • Przetwórz dokument z punktu danych 61 zbioru test ze zbioru danych (dataset), stosując odpowiedni prompt, aby dowiedzieć się, ile dni szkoleń formalnych zapewniono pracownikom w latach 2012–2013.