1. 学ぶ
  2. /
  3. コース
  4. /
  5. spaCyで学ぶNatural Language Processing

Connected

演習

spaCy での NER

Named entity recognition (NER) は、人名や地名など、文書内の重要な要素を簡単に特定するのに役立ちます。非構造化データを整理し、重要情報を検出できるため、大規模なデータセットを扱う際に不可欠です。この演習では、Named Entity Recognition を練習します。

en_core_web_sm は nlp として読み込まれています。Airline Travel Information System (ATIS) データセットからの 3 つのコメントが、texts というリストで用意されています。

指示

100 XP
  • リスト内包表記を使って、texts の各テキストに対応する Doc コンテナをすべて含むリスト documents を作成します。
  • 各 doc コンテナについて、doc.ents を反復処理して、各固有表現のテキストと対応するラベルを表示します。
  • 2 番目の Doc コンテナについて、6 番目のトークンのテキストと、その固有表現タイプを表示します。