1. 学ぶ
  2. /
  3. コース
  4. /
  5. spaCyで学ぶNatural Language Processing

Connected

演習

spaCyで複数パターンを使うEntityRuler

EntityRuler を使うと、エンティティを doc.ents に追加して固有表現認識の精度を高められます。この演習では、既存の nlp パイプラインに EntityRuler コンポーネントを追加し、複数のエンティティが正しく分類されることを確認します。

en_core_web_sm モデルはすでに読み込まれており、nlp として利用できます。example_text でサンプルテキストにアクセスでき、nlp と doc を使って、それぞれ spaCy モデルと example_text の Doc コンテナにアクセスします。

指示

100 XP
  • nlp モデルで example_text 中のエンティティのテキストとタイプのタプル一覧を表示します。
  • 小文字の brother と sisters にマッチする複数のパターンを定義し、PERSON ラベルに対応付けます。
  • nlp パイプラインに EntityRuler コンポーネントを追加し、patterns を EntityRuler に追加します。
  • nlp モデルで example_text のエンティティのテキストとタイプのタプルを表示します。