1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 확률 기초

Connected

연습 문제

잔차 분석하기

선형 모델을 구현하려면 예측값과 실제 데이터 사이의 거리인 잔차(residual) 를 살펴봐야 합니다.

다음 세 가지 조건을 만족해야 합니다:

  1. 평균이 0이어야 합니다.
  2. 분산이 일정해야 합니다.
  3. 분포가 정규분포를 따라야 합니다.

같은 과목에 대한 두 학교 A와 B의 시험 점수 데이터를 사용하겠습니다. 각각 hours_of_study_A 와 test_scores_A, hours_of_study_B 와 test_scores_B 로 model_A 와 model_B 를 적합해 두었습니다.

matplotlib.pyplot 은 plt 로, numpy 는 np 로, 그리고 sklearn.linear_model 에서 LinearRegression 이(가) 이미 임포트되어 있습니다.

지침 1/4

undefined XP
  • 1

    hours_of_study_A 와 test_scores_A 의 산점도를 그리고, hours_of_study_values_A 와 model_A 의 예측 결과를 함께 표시하세요.

  • 2

    예측값에서 test_scores_A 를 빼서 잔차를 구한 뒤, hours_of_study_A 와 residuals_A 로 산점도를 그리세요.

  • 3

    hours_of_study_B 와 test_scores_B 의 산점도를 그리고, hours_of_study_values_B 와 model_B 의 예측 결과를 함께 표시하세요.

  • 4

    예측값에서 test_scores_B 를 빼서 잔차를 구한 뒤, hours_of_study_B 와 residuals_B 로 산점도를 그리세요.