1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ自然言語処理(NLP)

Connected

演習

レンマ化(Lemmatization)

ユーザーレビューの分析を続ける中で、ステミングでは "flying" が "fli" のような標準的でない語になることがあり、可読性が下がる場合があると気づきました。そこで、実在する単語を返すレンマ化を使い、分析の明確さと精度を高めましょう。

WordNetLemmatizer はすでにインポート済みで、stop_words も定義済み、必要な NLTK リソースもダウンロード済みです。

指示

100 XP
  • WordNetLemmatizer() クラスのインスタンス lemmatizer を作成します。
  • lemmatizer を使って lower_tokens をレンマ化します。