1. 학습
  2. /
  3. 강의
  4. /
  5. spaCyで学ぶAdvanced NLP

Connected

연습 문제

語彙属性(Lexical attributes)

この例では、spaCy の Doc と Token オブジェクト、および語彙属性を使って、テキスト内のパーセンテージを見つけます。探すのは連続する2つのトークン、すなわち「数値」と「パーセント記号」です。英語モデルの nlp オブジェクトはすでに作成済みです。

지침

100 XP
  • like_num トークン属性を使って、doc 内のトークンが数値らしく見えるかを確認します。
  • 文書内で現在のトークンの「次」のトークンを取得します。doc における次のトークンのインデックスは token.i + 1 です。
  • 次のトークンの text 属性がパーセント記号 "%" かどうかを確認します。