1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. spaCyで学ぶNatural Language Processing

Connected

Exercises

空の spaCy モデルでの EntityRuler

EntityRuler を使うと、doc.ents にエンティティを追加できます。これは、固有表現認識の spaCy パイプラインコンポーネントである EntityRecognizer と組み合わせて精度を高めることも、単体で使ってルールベースのみの固有表現認識システムを実装することもできます。この演習では、空の英語の spaCy モデルに EntityRuler コンポーネントを追加し、与えられた text に対してルールベースのみで固有表現を分類する練習をします。

spaCy パッケージはすでにインポート済みで、空の英語 spaCy モデルが nlp として用意されています。小文字の openai と microsoft を ORG として分類するための patterns のリストも用意されています。

คำแนะนำ

100 XP
  • パイプラインに EntityRuler コンポーネントを作成して追加します。
  • 与えられたパターンを EntityRuler コンポーネントに追加します。
  • 与えられた text をモデルに通して、対応する Doc コンテナを作成します。
  • Doc コンテナ内のすべてのエンティティについて、(エンティティのテキスト, 種類)のタプルを出力します。