1. Învăţa
  2. /
  3. Courses
  4. /
  5. spaCyで学ぶAdvanced NLP

Connected

exercise

効率的なフレーズマッチング

個々のトークンを記述するパターンを書くよりも、完全一致の文字列をマッチさせたほうが効率的なことがあります。これは、世界のすべての国のように、有限のカテゴリを扱うときに特に有効です。

すでに国名のリストがあるので、これを情報抽出スクリプトの土台として使いましょう。文字列のリストは変数 COUNTRIES として利用できます。nlp オブジェクトとテスト用の doc はすでに作成済みで、doc.text はシェルに出力されています。

Instrucţiuni

100 XP
  • PhraseMatcher をインポートし、共有の vocab を使って初期化し、変数 matcher に代入します。
  • フレーズパターンを追加し、doc に対してマッチャーを呼び出します。