1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ自然言語処理(NLP)

Connected

演習

顧客レビューからの語彙の構築

あなたは消費者向け電子機器メーカー TechZone のプロダクトアナリティクスチームの一員です。新しいガジェットについて、少量の顧客レビューが届きました。これらを分析するために、まずテキストを前処理し、各レビューを数値データで表現する際の特徴を定義する、一意の単語リストである語彙(ボキャブラリ)を作成します。

preprocess() 関数はあらかじめ用意されています。テキストを小文字化し、トークン化し、句読点を除去します。

指示

100 XP
  • preprocess() 関数を使って、データセット内の各レビューを前処理します。
  • 前処理済みレビューに対して vectorizer をフィットさせます。
  • 得られた語彙を出力します。