1. Learn
  2. /
  3. Courses
  4. /
  5. R로 배우는 트리 기반 Machine Learning

Connected

Exercise

실제 튜닝 수행

최적의 하이퍼파라미터가 주어진 데이터에 가장 잘 맞는 모델을 만듭니다. 튜닝 그리드를 정했다면, 각 그리드 지점마다 모델을 학습하고 평가하여 어떤 지점에서 성능이 가장 좋은지 확인해야 해요.

k-겹 교차 검증을 사용하고, 앙상블 크기가 n 트리이며, 튜닝 그리드가 t개의 조합일 때 총 학습해야 하는 모델 수는 k * n * t로, 시간이 다소 걸릴 수 있어요.

이제 실제 튜닝을 직접 수행해 보세요! 미리 로드된 객체로는 customers_train과 이전 연습 문제의 결과인 boost_spec, tunegrid_boost가 있어요:

# A tibble: 27 x 3
   tree_depth    learn_rate  sample_size
        <int>         <dbl>        <dbl>
 1          1  0.0000000001         0.1 
 2          8  0.0000000001         0.1 
 3         15  0.0000000001         0.1 
 4          1  0.00000316           0.1 
 ...

Instructions

100 XP
  • vfold_cv()를 사용해 학습 데이터에 대해 6겹 폴드를 만들고 folds로 저장하세요.
  • tune_grid()를 사용해 boost_spec을 폴드, 튜닝 그리드, roc_auc 평가지표로 튜닝하세요. 결과는 tune_results로 저장하세요.
  • 튜닝 과정의 결과를 시각화하여 확인하세요.