1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Generalized Linear Models

Connected

exercise

범주형 변수 코딩하기

이전 연습 문제에서 연속형 변수에 대한 모델 행렬을 만들고 변수 변환을 적용하는 방법을 연습했어요. 이번 연습에서는 범주형 변수를 코딩하는 다양한 방법을 실습해 보겠습니다.

범주형 데이터는 서로 다른 그룹이나 요인에 따라 관계를 분석하고 비교할 수 있게 해줍니다. 따라서 기준(reference) 그룹을 어떻게 선택하는지가 중요하며, 연구 맥락에 따라 기본값과 다른 기준 그룹으로 바꾸고 싶을 때가 자주 있어요. 기준 그룹을 바꾸는 흔한 이유 중 하나는, 그렇게 했을 때 회귀계수 해석이 해당 연구에 더 알맞고 흥미로워지기 때문입니다.

이번 연습에서는 crab 데이터셋을 다시 사용하며, 여기서 color와 spine은 범주형 변수입니다.

crab 데이터셋은 워크스페이스에 미리 로드되어 있습니다.

Instruktioner 1 / 2

undefined XP
    1
    2
  • patsy에서 dmatrix를 가져오세요.
  • dmatrix()를 사용해 color를 범주형 변수로 처리하도록 C() 함수를 적용해 모델 행렬을 구성하고 출력하세요.