1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 배우는 추론 통계 기초

Connected

연습 문제

오류의 분포

현실 세계의 과정은 거의 완벽하게 예측할 수 없어요. 바람직한 결과는 오류가 정규분포를 따른다는 것입니다. 이는 실제 값이 예측값보다 큰 경우도, 작은 경우도 있다는 뜻이에요. 즉, 오류(실제 값과 예측값의 차이)가 0을 기준으로 무작위로 "흩어져" 있는 것처럼 보입니다.

이번 연습 문제에서는 경찰관의 급여를 예측하는 사전 구축된 선형 모델의 결과를 분석합니다. 그런 다음 오류가 대략 정규분포를 따르는지 확인해 볼 거예요. 예측값은 preds에, 실제 급여는 salaries에 리스트 형태로 저장되어 있습니다.

지침

100 XP
  • 오류를 실제 급여에서 예측 급여를 뺀 값으로 계산하세요.
  • 오류를 히스토그램으로 시각화하세요.
  • 오류에 대해 Anderson-Darling 정규성 검정을 수행하세요.
  • 귀무가설이 기각되는 significance_level(들)을 찾아 출력하세요.