1. 学ぶ
  2. /
  3. コース
  4. /
  5. Hugging Face で学ぶマルチモーダルモデル

Connected

演習

LayoutLM を使ったドキュメント VQA

画像の VQA からドキュメントの VQA へ!この演習では、layoutlm-document-qa モデルを使って、次のドキュメント画像から 2012~2013 年に従業員へ提供された研修時間の合計を特定します。

Newsletter from an ICT company

データセット(dataset)は読み込まれており、pipeline モジュール(pipeline)もインポート済みです。

指示

100 XP
  • タスクに 'document-question-answering'、チェックポイントに 'impira/layoutlm-document-qa' を指定して pipeline を読み込みます。
  • dataset の test セットのデータポイント 61 に含まれるドキュメントを、適切なプロンプトで処理して、2012~2013 年に従業員へ提供された正式な研修が何日間だったかを見つけてください。