1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 트리 기반 Machine Learning

Connected

연습 문제

AUC 비교

서로 다른 모델을 비교하는 일은 모델 선택의 핵심이에요. 마지막 두 개의 연습 문제에서는 이 강의에서 다룬 모든 모델(의사결정나무, 배깅 트리, 랜덤 포레스트, 그래디언트 부스팅)을 대상으로 성능을 비교해 보겠습니다.

모든 모델은 충분히 튜닝되었고 동일한 학습용 데이터셋 customers_train으로 학습했으며, customers_test 데이터셋에 대해 예측을 생성했어요. 예측 결과는 숫자 확률이며, 세션의 preds_combined로 제공됩니다:

tibble [1,011 × 5]
 $ preds_tree    : 0.144 0.441 ...
 $ preds_bagging : 0.115 0.326 ...
 $ preds_forest  : 0 0 0 0.286 ...
 $ preds_boosting: 0.136 0.149 ...
 $ still_customer: "no","no", ...

지침 1/3

undefined XP
  • 1
    • preds_combined의 각 예측 열에 대해, 항상 still_customer를 정답 열로 사용해 AUC를 계산하세요.
  • 2
    • 결과를 하나의 tibble로 합치세요.
  • 3
    • bind_rows()의 인자 이름이 decision_tree, bagged_tree, random_forest, boosted_tree가 되도록 코드를 수정하세요.