正則化つきの製品レビュー分析

この演習では、Amazon の製品レビュー reviews データセットをもう一度使います。ラベルのベクトル y は感情を表し、ポジティブなら 1、それ以外は 0 です。行列 X には、BOW 手法で作成した数値特徴量がすべて含まれています。

正則化の強さが異なる2つのロジスティック回帰モデルを学習し、テストデータでの性能を比較します。正則化はモデルの複雑さを制御する方法でしたね。正則化が強いほどモデルは柔軟性が下がる一方で、汎化性能が高まりやすくなります。高い正則化をかけたモデルは、正則化なしのモデルより精度が低くなることもよくあります。