1. 학습
  2. /
  3. 강의
  4. /
  5. Tidyverse로 배우는 Machine Learning

Connected

연습 문제

최적 모델 구축 및 평가

교차 검증(cross-validation)을 통해 gapminder의 모든 특성을 활용하여 life_expectancy를 예측하는 최적 모델을 선정했습니다. 모델을 선택했으니, 이제 별도로 보관해 둔 독립 데이터셋(testing_data)을 사용하여 새로운 데이터에 대한 모델 성능을 추정할 차례입니다.

모든 training_data로 모델을 구축하고, testing_data로 평가를 진행합니다.

지침

100 XP
  • ranger()를 사용하여 모든 학습 데이터로 최적 모델(mtry = 4)을 구축하고, 결과를 best_model에 할당하세요.
  • testing_data에서 life_expectancy 열을 추출하여 test_actual에 할당하세요.
  • best_model을 사용해 testing 데이터의 life_expectancy를 예측하고, 결과를 test_predicted에 할당하세요.
  • test_actual과 test_predicted 벡터를 사용하여 MAE를 계산하세요.