1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ自然言語処理(NLP)

Connected

演習

ステミング

review テキストをクリーニングし、ストップワードと句読点を除去できました。次は、残った単語をステミングで正規化し、語を語幹に還元します。これにより、似た単語をまとめられ、分析がより一貫して効率的になります。

PorterStemmer クラスと、clean_tokens のリストが用意されています。

指示

100 XP
  • PorterStemmer() を初期化します。
  • リスト内包表記を使って、clean_tokens リスト内の各トークンをステミングします。