1. Учиться
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Generalized Linear Models

Connected

Exercise

예측값 계산하기

실무에서는 적합한 로지스틱 회귀 모델을 사용해 확률을 추정하고, 그 추정값에 대한 신뢰구간을 만드는 데 관심이 많습니다. wells 데이터셋과 모델 'switch ~ arsenic'을 사용한다고 할 때, 학습 표본에 포함되지 않은 새로운 관측치 wells_test가 있고 가장 가까운 안전한 우물로 바꿀 확률을 예측하려고 한다고 가정해 봅시다.

이를 위해 .predict() 메서드를 사용합니다.

.predict()는 다음과 같은 인자를 받습니다:

  • exog - 새로운 관측치(테스트 데이터셋)
  • transform = True - 적합에 사용된 공식 y ~ x를 데이터에 적용합니다.

exog를 지정하지 않으면 학습 데이터셋에 대한 확률이 계산됩니다.

모델 wells_fit과 데이터셋 wells, wells_test는 작업 공간에 미리 로드되어 있습니다.

Инструкции

100 XP
  • 적합한 모델 wells_fit을 사용해 테스트 데이터 wells_test에 대한 예측을 계산하고 prediction으로 저장하세요.
  • 기존 데이터프레임 wells_test에 prediction을 추가하고 열 이름을 prediction으로 지정하세요.
  • print()를 사용해 wells_test의 처음 5행에서 switch, arsenic, prediction 열을 표시하세요. 처음 5행만 보려면 pandas의 head() 함수를 사용하세요.