1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 Supervised Learning: 분류

Connected

연습 문제

단순 로지스틱 회귀 모델 만들기

donors 데이터셋에는 마비 군(軍) 재향군인을 위한 모금 우편을 받은 사람 93,462건의 예제가 들어 있습니다. donated 열은 우편에 응답해 기부했으면 1, 그렇지 않으면 0입니다. 이 이진 결과가 로지스틱 회귀 모델의 종속 변수입니다.

나머지 열은 잠재 기부자의 특성으로, 기부 행동에 영향을 줄 수 있습니다. 이는 모델의 독립 변수입니다.

회귀 모델을 만들 때는 어떤 독립 변수가 종속 변수를 잘 예측할지에 대한 가설을 세워 보는 것이 종종 도움이 됩니다. 잘못된 우편 주소에 대해 1, 그렇지 않으면 0으로 표시되는 bad_address 열은 기부 가능성을 낮출 것처럼 보입니다. 비슷하게, 종교적 관심(interest_religion)과 재향군인 이슈에 대한 관심(interest_veterans)은 더 많은 자선 기부와 연관될 수 있다고 의심해 볼 수 있습니다.

이 연습 문제에서는 이 세 가지 요인을 사용해 기부 행동에 대한 간단한 모델을 만들어 보겠습니다. donors 데이터셋이 준비되어 있습니다.

지침

100 XP
  • str() 함수를 사용해 donors를 살펴보세요.
  • table() 함수를 사용해 donated 변수의 각 수준이 몇 번 나타나는지 세어 보세요.
  • 앞에서 설명한 세 개의 독립 변수를 사용해 formula 인터페이스로 로지스틱 회귀 모델을 적합하세요.
    • glm()을 공식(formula)을 첫 번째 인수로, 데이터 프레임을 data 인수로 넘겨 호출하세요.
    • 결과를 donation_model로 저장하세요.
  • summary()로 모델 객체를 요약하세요.