最適な L1 罰則係数を見つける

ここでは L1 正則化の C パラメータをチューニングし、モデルの複雑さを抑えつつ、性能指標を良好に保てる値を見つけます。可能な C 値について for ループを回し、各候補でロジスティック回帰を構築し、性能指標を計算します。

候補値を含むリスト C は用意されています。配列 l1_metrics は3列で作成され、1列目に C、2列目と3列目は非ゼロ係数の数とモデルの再現率のプレースホルダーです。スケーリング済みの特徴量と目的変数は、学習用に train_X, train_Y、テスト用に test_X, test_Y として読み込まれています。

numpy と pandas はそれぞれ np と pd として、また sklearn から recall_score 関数も読み込まれています。