1. Lära sig
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶマーケティングのための機械学習

Connected

exercise

最適な L1 罰則係数を見つける

ここでは L1 正則化の C パラメータをチューニングし、モデルの複雑さを抑えつつ、性能指標を良好に保てる値を見つけます。可能な C 値について for ループを回し、各候補でロジスティック回帰を構築し、性能指標を計算します。

候補値を含むリスト C は用意されています。配列 l1_metrics は3列で作成され、1列目に C、2列目と3列目は非ゼロ係数の数とモデルの再現率のプレースホルダーです。スケーリング済みの特徴量と目的変数は、学習用に train_X, train_Y、テスト用に test_X, test_Y として読み込まれています。

numpy と pandas はそれぞれ np と pd として、また sklearn から recall_score 関数も読み込まれています。

Instruktioner

100 XP
  • リスト C の長さに基づき、0 からその範囲で for ループを回します。
  • 各 C 候補について、Logistic Regression を初期化して学習し、テストデータで churn を予測します。
  • 各 C 候補について、非ゼロ係数の数と再現率を l1_metrics の第2列・第3列に保存します。
  • l1_metrics から適切な列名を付けて pandas の DataFrame を作成します。