1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶアンサンブル手法

Connected

Exercises

GBM を使った感情分析

reviews データセットに対して、scikit-learn の GradientBoostingClassifier を使い、テキストからレビューの感情を予測してみましょう。

モデルへの入力として生のテキストは渡しません。以下の前処理はあらかじめ実施済みです。

  1. 欠損のあるレビューを削除。
  2. 上位5つのアプリのデータを選択。
  3. レビューをランダムに500件サブサンプリング。
  4. レビューから「ストップワード」を除去。
  5. レビューを行列に変換(各特徴量はレビュー内の単語の出現頻度を表します)。

テキストマイニングをもっと深く学びたい方は、Introduction to Natural Language Processing in Python のコースもぜひご覧ください!

คำแนะนำ

100 XP
  • 100 個の推定器と 0.1 の学習率を持つ GradientBoostingClassifier を作成します。
  • テストセットで予測を計算します。
  • モデルを評価するために正解率を算出します。
  • 混同行列を計算して出力します。