1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ自然言語処理(NLP)

Connected

Exercise

ステミング

review テキストをクリーニングし、ストップワードと句読点を除去できました。次は、残った単語をステミングで正規化し、語を語幹に還元します。これにより、似た単語をまとめられ、分析がより一貫して効率的になります。

PorterStemmer クラスと、clean_tokens のリストが用意されています。

Instructions

100 XP
  • PorterStemmer() を初期化します。
  • リスト内包表記を使って、clean_tokens リスト内の各トークンをステミングします。