1. 学ぶ
  2. /
  3. コース
  4. /
  5. Hugging Face を使いこなす

Connected

演習

長文を要約する

要約は、大量のテキストを扱いやすい内容に圧縮し、長い記事や文書から主要なポイントを素早く把握できるようにします。

主な手法は2つあります。抽出的要約は元の文から重要な文を選び、抽象的要約は要点を新しい文で表現し直します。

この演習では、Hugging Face の pipeline() 関数と cnicu/t5-small-booksum モデルを使って、抽象的要約のパイプラインを作成します。ギリシャに関する Wikipedia ページのテキストを要約し、抽象的モデルが言い換えた出力を元の文と比較します。

transformers ライブラリの pipeline 関数と、original_text はすでに読み込まれています。

指示

100 XP
  • タスクに "summarization" を指定して要約用の pipeline を作成し、summarizer として保存します。
  • 新しいパイプラインでテキストの要約を作成し、summary_text として保存します。
  • 元のテキストと要約のテキストの長さを比較します。