1. 学习
  2. /
  3. 课程
  4. /
  5. PythonでMachine Learningを使ってCTRを予測する

Connected

练习

正解率だけではない評価

この演習では、正解率を見るだけでなく、基本的な決定木モデルに対して ROC 曲線の AUC を評価します。ランダムな分類器のベースラインは AUC が 0.5 であることを思い出してください。したがって、目標は 0.5 より高いスコアを達成することです。

X は特徴量の DataFrame、y は目的変数の DataFrame として利用可能です。sklearn と pandas(pd)もワークスペースで利用できます。

このセットアップを使って、ROC 曲線の AUC を確認していきます。

说明

100 XP
  • データを学習用とテスト用に分割します。
  • 学習データで分類器を学習し、predict_proba() と predict() を使ってテストデータに対する予測を行います。
  • roc_curve(y_test, y_score[:, 1]) のように、roc_curve() 関数を y_test に対して用いて、ROC 曲線下面積(AUC)を評価します。