1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

演習

正則化つきの製品レビュー分析

この演習では、Amazon の製品レビュー reviews データセットをもう一度使います。ラベルのベクトル y は感情を表し、ポジティブなら 1、それ以外は 0 です。行列 X には、BOW 手法で作成した数値特徴量がすべて含まれています。

正則化の強さが異なる2つのロジスティック回帰モデルを学習し、テストデータでの性能を比較します。正則化はモデルの複雑さを制御する方法でしたね。正則化が強いほどモデルは柔軟性が下がる一方で、汎化性能が高まりやすくなります。高い正則化をかけたモデルは、正則化なしのモデルより精度が低くなることもよくあります。

指示

100 XP
  • データを学習用とテスト用に分割します。
  • 正則化パラメータを 1000 にしたロジスティック回帰を学習します。さらに、正則化パラメータを 0.001 にした2つ目のロジスティック回帰も学習します。
  • どちらのモデルについても、テストデータでの正解率を出力します。