1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ Natural Language Processing 入門

Connected

演習

NLTK と spaCy の NER を比較する

この章の最初の演習で使ったのと同じテキストを使い、今度は spaCy の NER アノテーターでの結果を確認します。結果はどう違うでしょうか。

記事は article としてあらかじめ読み込まれています。実行時間を短くするため、この演習で必要なのは entity のみなので、spaCy モデルを読み込むときはキーワード引数 disable=['tagger', 'parser', 'matcher'] を指定してください。

指示

100 XP
  • spacy をインポートします。
  • spacy.load() を使って 'en_core_web_sm' モデルを読み込みます。追加のキーワード引数として disable=['tagger', 'parser', 'matcher'] を指定します。
  • article を nlp() に渡して、spacy のドキュメントオブジェクトを作成します。
  • 反復変数を ent として、doc のエンティティを走査し、ラベル(ent.label_)とテキスト(ent.text)を出力します。