1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Generalized Linear Models

Connected

연습 문제

다변량 로지스틱 회귀 적합하기

영상에서 배운 내용을 바탕으로 crab 데이터셋을 다시 살펴보고 다변량 로지스틱 회귀 모델을 적합해 보세요. 2장에서 width를 설명 변수로 하는 로지스틱 회귀를 적합했죠. 이번 연습에서는 여기에 추가 변수인 color를 더했을 때의 효과를 분석합니다.

color 변수는 자연스러운 순서가 있으며, medium light, medium, medium dark, dark로 구분됩니다. 따라서 color는 서열형(ordinal) 변수이며, 이 예제에서는 정량 변수처럼 다뤄 보겠습니다.

crab 데이터셋은 워크스페이스에 미리 로드되어 있어요. 또한 단변량 사례와 코드 차이는 formula 인자뿐임에 유의하세요. 이제 여기에 새 변수를 포함하도록 식을 확장하면 됩니다.

지침

100 XP
  • GLM을 위해 statsmodels 라이브러리에서 필요한 함수를 임포트하세요.
  • width와 color를 설명 변수, y를 반응 변수로 하는 formula 인자를 정의하세요.
  • glm() 함수를 사용해 다변량 로지스틱 회귀 모델을 적합하세요.
  • 모델 결과를 출력하세요.