1. Lära sig
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

exercise

スペイン語レビューのステミング

前のチャプターで、Amazon の商品レビューの言語を判定するために言語検出パッケージを使ったことを思い出してください。この演習では、まず non_english_reviews の各レビューの言語を検出します。レビューは複数言語で書かれていますが、ここではスペイン語のもの「だけ」を選びます。概念を忘れてしまった場合は、外国語検出についての動画に戻って復習しても大丈夫です。

次のステップでは、スペイン語レビューから単語トークンを作成し、スペイン語用の SnowBall ステマーでステミングします。 残念ながら、言語検出パッケージは完璧ではありません。そのため、検出された言語が誤っている場合もあります。

Instruktioner 1 / 2

undefined XP
    1
    2
  • langdetect パッケージをインポートします。
  • len() と range() を使って non_english_reviews の各行を反復処理します。
  • for ループ内で detect_langs() を使い、各レビューの言語を検出します。