1. 학습
  2. /
  3. 강의
  4. /
  5. R로 하는 Supervised Learning: 회귀

Connected

연습 문제

RMSE 계산하기

이번 연습 문제에서는 실업률 모델의 RMSE를 계산해 보겠습니다. 이전 코딩 연습에서 unemployment 데이터셋에 다음 두 열을 추가했어요:

  • 모델의 예측값(predictions 열)
  • 예측값과 실제 결과의 차이인 잔차(residuals 열)

잔차 벡터 $res$로부터 RMSE는 다음과 같이 계산할 수 있습니다:

$$ RMSE = \sqrt{\operatorname{mean}(res^2)} $$

RMSE는 작을수록 좋습니다. 그렇다면 어느 정도가 "작다"고 볼 수 있을까요? 한 가지 휴리스틱은 결과 변수의 표준편차와 RMSE를 비교하는 것입니다. 좋은 모델이라면 RMSE가 더 작아야 합니다.

unemployment 데이터 프레임은 미리 로드되어 있습니다.

지침

100 XP
  • 이전 연습 문제의 unemployment 데이터를 확인하세요.
  • 편의를 위해, unemployment의 residuals 열을 변수 res에 할당하세요.
  • RMSE를 계산하세요: res를 제곱하고, 그 평균을 구한 뒤 제곱근을 취합니다. 이를 변수 rmse에 할당하고 출력하세요.
    • 팁: 할당을 괄호로 감싸면 한 줄로 할 수 있습니다: (rmse <- ___)
  • female_unemployment의 표준편차를 계산해 변수 sd_unemployment에 할당하고 출력하세요. 모델의 rmse는 데이터의 표준편차와 비교했을 때 어떤가요?