1. 学ぶ
  2. /
  3. コース
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

演習

適合率と再現率

適合率と再現率は、前のレッスンで説明した4つの予測結果に関連しており、どのMachine Learningモデルにとっても重要な評価指標です。広告のCTRモデルでは、理想的には適合率が高い(広告費に対するROIが高い)ことと、再現率が高い(適切なオーディエンスに届いている)ことが求められます。適合率と再現率は手計算も可能ですが、sklearn には既存のワークフローに簡単に組み込める便利な実装があります。この演習では、決定木をセットアップし、適合率と再現率を計算します。

pandas モジュールはワークスペースで pd として利用でき、サンプルのDataFrameは df として読み込まれています。特徴量は X、目的変数は y に読み込まれており、そのまま使用できます。さらに、sklearn.metrics の precision_score() と recall_score() も利用可能です。

指示

100 XP
  • X と y の学習用・テスト用の分割を作成します。
  • 決定木分類器を定義し、モデルを学習して予測 y_pred を作成します。
  • sklearn の実装を用いて適合率と再現率のスコアを取得します。