1. 학습
  2. /
  3. 강의
  4. /
  5. R로 하는 Supervised Learning: 회귀

Connected

연습 문제

상호작용 모형화하기

이 연습 문제에서는 상호작용을 사용해 성별과 위(胃) 활성도가 알코올 대사에 미치는 영향을 모형화해 보겠습니다.

alcohol 데이터 프레임은 미리 로드되어 있으며 다음 열을 포함합니다:

  • Metabol: 알코올 대사율
  • Gastric: 위 알코올 탈수소효소 활성도
  • Sex: 음주자의 성별(Male 또는 Female)

영상에서는 alcohol 데이터에 대해 세 가지 모형을 적합했습니다:

  • 더하기(주효과) 항만 포함한 모형: Metabol ~ Gastric + Sex
  • 위 활성도와 성별 간 상호작용을 포함한 두 개의 모형

상호작용 항이 있는 모형 중 하나가 더하기 모형보다 더 높은 R-squared를 보여, 상호작용 항을 사용하면 적합도가 더 좋아짐을 확인했습니다. 이 연습 문제에서는 상호작용 모형 중 하나와 주효과만 있는 모형의 R-squared를 비교해 보겠습니다.

연산자 :는 두 변수 간 상호작용을 의미합니다. 연산자 *는 두 변수 간 상호작용과 두 변수의 주효과를 모두 의미합니다.

x*y = x + y + x:y

지침

100 XP
  • 상호작용 없이 Gastric과 Sex의 함수로 Metabol을 표현하는 공식을 작성하세요.
    • 공식을 변수 fmla_add에 할당하고 출력하세요.
  • Gastric과 Sex 간 상호작용의 함수로 Metabol을 표현하는 공식을 작성하세요.
    • 주효과로는 Gastric만 추가하고, Sex는 추가하지 마세요.
    • 공식을 변수 fmla_interaction에 할당하고 출력하세요.
  • 주효과만 포함한 선형 모형 model_add를 데이터에 적합하세요.
  • 상호작용을 포함한 선형 모형 model_interaction을 데이터에 적합하세요.
  • 두 모형 모두에 summary()를 호출하세요. 어느 쪽의 R-squared가 더 좋은가요?