오류의 분포

현실 세계의 과정은 거의 완벽하게 예측할 수 없어요. 바람직한 결과는 오류가 정규분포를 따른다는 것입니다. 이는 실제 값이 예측값보다 큰 경우도, 작은 경우도 있다는 뜻이에요. 즉, 오류(실제 값과 예측값의 차이)가 0을 기준으로 무작위로 "흩어져" 있는 것처럼 보입니다.

이번 연습 문제에서는 경찰관의 급여를 예측하는 사전 구축된 선형 모델의 결과를 분석합니다. 그런 다음 오류가 대략 정규분포를 따르는지 확인해 볼 거예요. 예측값은 preds에, 실제 급여는 salaries에 리스트 형태로 저장되어 있습니다.