1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ Natural Language Processing 入門

Connected

演習

polyglot によるスペイン語の NER

ここでは polyglot を使ってスペイン語のアノテーションを続けます。この記事は新聞社のものではなく、よりブログ的な文体の最初の例です。固有表現の抽出結果はどう変わりそうでしょうか。

Text オブジェクトは txt として作成済みで、各エンティティは IPython Shell に表示されています。

ここでの課題は、エンティティのうちいくつが "Márquez" または "Gabo" を含むかを数えることです。これらは同じ人物を指す別の呼び方です。

指示

100 XP
  • 反復変数を ent として、txt のすべてのエンティティを走査します。
  • そのエンティティが "Márquez" または "Gabo" を含むか確認し、含まれていれば count を増やします。"Márquez" のアクセント付きの á を忘れないでください。
  • Gabriel García Márquez(別名 Gabo)に言及するエンティティの割合を確認するために、"Submit Answer" をクリックしてください。