1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Generalized Linear Models

Connected

Exercise

선형 모델과 이진 반응 변수

영상에서는 이진 반응 변수에 선형 모델을 적합했을 때 얼마나 빠르게 문제가 생길 수 있는지 살펴보았습니다. 선형 적합선으로부터 얻은 적합값 $\hat{y}$가 반응 변수가 0과 1만을 취한다는 문제의 논리와 맞지 않을 수 있다는 점을 배웠지요.

사전 로드된 crab 데이터셋을 사용해, GLM 프레임워크로 y를 x의 함수로 모델링하며 이 효과를 살펴보겠습니다.

GLM 모델의 기본 형식은 다음과 같습니다:

glm(formula = 'y ~ X', data = my_data, family = sm.families.____).fit()

여기서 formula, data, family를 지정합니다.

또한, 다음을 기억하세요.

  • Gaussian family를 사용한 GLM은 선형 모델입니다(GLM의 특수한 경우).
  • Binomial family를 사용한 GLM은 로지스틱 회귀 모델입니다.

Instructions

100 XP
  • crab 데이터셋을 사용해 y가 width로 예측되도록 모델 공식을 정의하세요.
  • GLM 공식을 사용해 선형 모델을 적합하려면, y가 연속형이고 근사적으로 정규분포를 따른다고 가정하는 Gaussian()을 family 인수로 사용하세요.
  • GLM 공식을 사용해 로지스틱 모델을 적합하려면 Binomial()을 family 인수로 사용하세요.
  • glm()에 적절한 인수를 넣어 모델을 적합하고, print()와 summary()로 적합된 모델의 요약을 확인하세요.