1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Generalized Linear Models

Connected

연습 문제

승산 관점에서의 계수

이전에는 arsenic 수준에 따라 우물을 바꾸는지의 확률에 대해 로지스틱 회귀 모형을 적합했어요. 이번 연습에서는 또 다른 변수 distance100이 전환 확률과 어떻게 관련되는지 살펴보고, 계수 값을 승산 관점에서 해석해 볼 거예요.

로지스틱 회귀 모형은 로그 승산(log odds)으로 표현되므로, x가 한 단위 증가할 때 승산이 얼마나 곱해지는지 알아보려면 계수 추정치를 지수화하면 돼요. 이를 오즈비(odds ratio)라고도 합니다.

승산(odds)은 사건이 발생할 확률 대비 발생하지 않을 확률의 비율이에요. 예를 들어, 어떤 게임에서 승산이 1/2 또는 1 대 2(1:2)라면, 한 번 이길 때마다 두 번 진다는 뜻입니다.

데이터셋 wells는 작업 공간에 불러와져 있어요.

지침

100 XP
  • statsmodels 라이브러리와 statsmodels.formula.api에서 glm 함수를 가져오세요. 또한 numpy를 np로 임포트하세요.
  • glm()을 사용해 switch를 distance100으로 예측하는 로지스틱 회귀 모형을 적합하세요.
  • .params를 사용해 모형 계수를 추출하세요.
  • numpy의 exp() 함수를 사용해 승산에 대한 곱셈 효과를 계산하세요.