1. 学习
  2. /
  3. 课程
  4. /
  5. spaCyで学ぶNatural Language Processing

Connected

练习

spaCy の拡張構文でのマッチング

ルールベースの情報抽出は、あらゆるNLPパイプラインにとって重要です。Matcher クラスでは、中かっこ内にいくつかの演算子を使えるため、より表現力のあるパターンを定義できます。これらの演算子は、拡張比較のためのもので、Python の in / not in や比較演算子に似ています。この演習では、spaCy のマッチング機能である Matcher を使って、サンプルテキストから指定の用語に一致する箇所を見つける練習をします。

Matcher クラスはすでに spacy.matcher ライブラリからインポートされています。この演習では、例文の Doc コンテナとして doc を使用します。事前に読み込まれた spaCy モデルは nlp で参照できます。

说明

100 XP
  • Matcher と nlp を使って matcher オブジェクトを定義します。
  • IN 演算子を使って、tiny squares と tiny mouthful にマッチするパターンを定義します。
  • このパターンを使って doc の一致箇所を見つけます。
  • 一致した開始・終了トークンのインデックスと、そのテキストスパンを出力します。