1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶTree-Based ModelsによるMachine Learning

Connected

演習

AUC を比較する

異なるモデルを比較することは、モデル選択の中心となる作業です。最後の2つの演習では、このコースで扱ったすべての種類のモデル(決定木、バギング木、ランダムフォレスト、勾配ブースティング)を横断してモデル比較を行います。

各モデルは最適にチューニングされ、同じ学習用データ customers_train で学習し、customers_test データセットに対して予測を行いました。結果は数値の確率で、セッション内の preds_combined として利用できます。

tibble [1,011 × 5]
 $ preds_tree    : 0.144 0.441 ...
 $ preds_bagging : 0.115 0.326 ...
 $ preds_forest  : 0 0 0 0.286 ...
 $ preds_boosting: 0.136 0.149 ...
 $ still_customer: "no","no", ...

指示1 / 3

undefined XP
  • 1
    • preds_combined の各予測列について、still_customer を常に正解(truth)列として用いて AUC を計算します。
  • 2
    • 結果を1つの tibble にまとめてください。
  • 3
    • bind_rows() の引数に decision_tree、bagged_tree、random_forest、boosted_tree という名前を付けるようにコードを変更してください。