R-제곱

앞서 다른 적합도 지표인 R-제곱(R-squared)을 RSS와 VAR의 비율로 표현했어요. 이 비율의 위아래에 1/n을 곱하면, 수치적으로는 우리가 모델링하는 데이터에서 선형 추세의 분산 대비 잔차의 분산의 비율로 볼 수 있어요. 이는 선형 추세를 제거한 뒤의 잔차의 분산과 대비해, 모델이 데이터의 분산을 얼마나 "설명"하는지를 나타내는 지표로 해석할 수 있습니다.

여기서는 x_data, y_data와 최적 적합 모델의 예측값 y_model이 미리 로드되어 있어요. 이 선형 모델이 데이터의 변동을 얼마나 설명하는지 정량화하기 위해 R-제곱 값을 계산해 보세요.