1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Generalized Linear Models

Connected

Exercise

예측값 비교하기

이전 연습 문제에서 crab 데이터를 사용해 width로 y를 예측하는 선형 회귀와 GLM(로지스틱) 회귀 모델을 모두 적합했어요. 즉, 암컷의 너비가 주어졌을 때 주변에 위성 게(satellite crab)가 있을 확률을 예측하고자 했습니다.

이번 연습 문제에서는 두 모델에서 나온 추정 확률(출력)을 더 살펴보고, 이 문제에 선형 적합이 적절한지 추론해 보겠습니다.

일반적으로 모델은 새로운, 즉 보지 못한 데이터로 시험합니다. 이런 데이터셋을 test 샘플이라고 해요.
test 샘플은 미리 만들어져 작업 공간에 불러와 두었습니다. 이 예시에서는 모델에 포함된 모든 변수, 즉 width에 대한 테스트 값이 필요하다는 점에 유의하세요.

crab 데이터셋은 작업 공간에 미리 로드되어 있습니다.

Instrukcje

100 XP
  • print()를 사용해 test 세트를 확인하세요.
  • test 샘플을 사용해 적합된 선형 모델 model_LM에 .predict()를 적용하여 추정 확률을 계산하고 pred_lm으로 저장하세요. 또한, 적합된 GLM(로지스틱) 모델 model_GLM에 .predict()를 적용해 추정 확률을 계산하고 pred_glm으로 저장하세요.
  • pandas의 DataFrame()을 사용해 두 모델의 예측을 결합하고 predictions로 저장하세요.
  • test와 predictions를 이어 붙여 all_data로 저장하세요. print()로 all_data를 확인하세요.