1. Учиться
  2. /
  3. Courses
  4. /
  5. R로 하는 Supervised Learning: 회귀

Connected

Exercise

R-squared 계산하기

이제 모델 예측의 RMSE를 계산했으니, 모델이 데이터를 얼마나 잘 설명하는지 살펴보겠습니다. 즉, 분산을 얼마나 설명하는지를 확인해 보죠. 이를 위해 $R^2$를 사용할 수 있어요.

$y$를 실제 결과, $p$를 모델의 예측값, 그리고 $res = y - p$를 예측의 잔차라고 합시다.

그러면 데이터의 총제곱합 \(tss\)("총분산")은 다음과 같습니다.

$$ tss = \sum{(y - \overline{y})^2} $$

여기서 $\overline{y}$는 $y$의 평균값입니다.

모델의 잔차제곱합 $rss$는 다음과 같습니다. $$ rss = \sum{res^2} $$

모델이 설명하는 분산인 $R^2$는 다음과 같습니다.

$$ 1 - \frac{rss}{tss} $$

$R^2$를 계산한 후, glance()(docs)가 보고하는 $R^2$와 비교해 보세요. glance()는 한 행짜리 데이터 프레임을 반환하며, 선형 회귀 모델의 경우 반환되는 열 중 하나가 학습 데이터에서의 모델 $R^2$입니다.

unemployment 데이터 프레임이 미리 로드되어 있으며, 이전 연습 문제에서 계산한 predictions와 residuals 열을 포함하고 있어요. unemployment_model도 사용하실 수 있습니다.

Инструкции

100 XP
  • female_unemployment의 평균을 계산해 변수 fe_mean에 할당하세요.
  • 총제곱합을 계산해 변수 tss에 할당하세요.
  • 잔차제곱합을 계산해 변수 rss에 할당하세요.
  • $R^2$를 계산하세요. 잘 맞는 모델인가요($R^2$가 1에 가까운가요)?
  • glance()로 모델의 $R^2$를 가져오세요. 같은 값으로 계산되었나요?