1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 트리 기반 Machine Learning

Connected

연습 문제

샘플 내 성능(In-sample performance)

회귀 모델이 유용한지 확인하는 것은 매우 중요해요. 유용한 모델은 학습 데이터의 구조를 잘 포착하는 모델일 수 있어요. 이러한 샘플 내(in-sample) 성능을 평가하는 한 가지 방법은 학습 데이터에 대해 예측하고 모든 예측 지점의 평균 절대 오차를 계산하는 거예요.

이 연습에서는 MAE(mean absolute error)를 사용해 샘플 내 예측을 평가해 볼 거예요. MAE는 예측값이 실제 값에서 평균적으로 얼마나 떨어져 있는지를 알려줘요.

다음 공식으로 계산하며, 여기서 $n$은 생성한 예측의 개수예요:

$$MAE = \frac{1}{n} \cdot \sum_{i=1}^n \text{absolute value of the }i\text{th error}$$

작업 공간에는 이전 연습에서 만든 회귀 트리인 model 이 준비되어 있어요.

지침

100 XP
  • model을 사용해 chocolate_train tibble에 대해 예측을 수행하여 in_sample_predictions를 만드세요.
  • 샘플 내 예측값과 실제 등급의 절대 차이를 담은 벡터 abs_diffs를 계산하세요.
  • 위 공식을 따라 평균 절대 오차를 계산하세요.