1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Generalized Linear Models

Connected

Exercise

범주형 변수로 모델링하기

이전 연습 문제에서 width와 함께 설명 변수로 color를 사용해 로지스틱 회귀 모델을 적합했는데, 그때는 color를 양적 변수로 취급했어요. 이번 연습에서는 color를 범주형 변수로 취급합니다. 모델 행렬을 구성할 때 color는 0/1 인코딩으로 3개의 변수로 변환돼요.

기본적으로 dmatrix()에서는 첫 번째 그룹이 기준 그룹으로 인코딩됩니다. 모델 행렬을 데이터프레임으로 보려면 dmatrix()의 추가 인수인 return_type을 'dataframe'으로 설정하세요.

color 변수에는 다음과 같은 자연스러운 순서가 있어요:
1: medium light
2: medium
3: medium dark
4: dark

crab 데이터셋은 작업 공간에 미리 로드되어 있습니다.

Instrukcje 1 / 4

undefined XP
    1
    2
    3
    4
  • color를 변수로 포함한 model_matrix를 구성하세요. color는 범주형으로 처리하고, Treatment() 함수를 사용해 기준 그룹을 4로 설정하세요.
  • 반응 변수로 y를 사용하여 로지스틱 모델을 적합하고 결과를 출력하세요.