1. Uczyć się
  2. /
  3. Courses
  4. /
  5. R에서 Generalized Linear Models

Connected

Exercise

로지스틱 회귀 결과 비교하기

모델을 구축할 때는, 모델에서 추정하는 매개변수의 수보다 관측치가 더 많아야 합니다. 이 여분의 변수는 자유도라고 합니다.

관측치가 너무 적은 모델은 과적합이 되기 쉽고, 아예 적합이 불가능할 수도 있습니다(때때로 특이(singular)하다고 합니다). 또한 자유도를 확인하면 데이터와 코드를 이중 점검하는 데 도움이 됩니다. 예를 들어, 자유도와 여러분이 생각하는 관측치 수가 맞지 않는다면, 데이터 정제가 더 필요하거나 코드에 버그가 있거나 모델링 오류가 있을 수 있다는 신호입니다.

glm()의 wide 형식과 long 형식 입력은 데이터의 행 수가 달라 관측치 수가 다르다고 모델이 인식하기 때문에 자유도가 다르게 계산됩니다.

앞선 연습 문제에서 세 가지 서로 다른 입력 옵션으로 로지스틱 회귀를 적합했습니다. 이 모델들은 lr_1, lr_2, lr_3로 로드되어 있습니다. 이 세 모델의 요약 정보를 확인해 보세요.

모델별로 자유도는 어떻게 달라지나요?

Instrukcje

50 XP

Możliwe odpowiedzi