1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 선형 모델 입문

Connected

연습 문제

R-제곱

앞서 다른 적합도 지표인 R-제곱(R-squared)을 RSS와 VAR의 비율로 표현했어요. 이 비율의 위아래에 1/n을 곱하면, 수치적으로는 우리가 모델링하는 데이터에서 선형 추세의 분산 대비 잔차의 분산의 비율로 볼 수 있어요. 이는 선형 추세를 제거한 뒤의 잔차의 분산과 대비해, 모델이 데이터의 분산을 얼마나 "설명"하는지를 나타내는 지표로 해석할 수 있습니다.

여기서는 x_data, y_data와 최적 적합 모델의 예측값 y_model이 미리 로드되어 있어요. 이 선형 모델이 데이터의 변동을 얼마나 설명하는지 정량화하기 위해 R-제곱 값을 계산해 보세요.

지침

100 XP
  • residuals는 y_model에서 y_data를 빼서 계산하고, deviations는 y_data의 np.mean()에서 y_data를 빼서 계산하세요.
  • np.mean()과 np.square()를 사용해 residuals의 분산과 deviations의 분산을 각각 계산하세요.
  • r_squared를 1에서 var_residuals / var_deviations의 비율을 뺀 값으로 계산하고, 결과를 출력하세요.