1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. R로 배우는 트리 기반 Machine Learning

Connected

Bài tập

폴드 평가하기

이제 10개의 폴드를 사용해 10개의 모델을 학습하고, 각 모델의 MAE와 RMSE를 계산했으니, 오차 규모를 시각화해 볼 차례예요. 이렇게 하면 샘플 밖 오차 분포에 대한 감을 익힐 수 있고, 모델 품질을 평가하는 데 도움이 됩니다.

이 모든 오차를 히스토그램으로 그려 보고, 모든 폴드에 걸친 요약 통계를 표시해 볼 거예요.

이전 연습 문제의 결과인 fits_cv가 미리 로드되어 있어요.

Hướng dẫn

100 XP
  • 단일 yardstick 함수를 사용해 fits_cv의 모든 모델에 대한 샘플 밖 오차를 수집하고, 이를 all_errors로 저장하세요.
  • .estimate를 x 미학으로 사용하고, 막대는 .metric으로 fill하여 ggplot2 히스토그램을 만드세요.
  • 첫 번째 지침에서 사용한 것과 같은 함수를 summarize = TRUE로 사용해 fits_cv의 요약 통계를 표시하세요.