1. 학습
  2. /
  3. 강의
  4. /
  5. R로 하는 Supervised Learning: 회귀

Connected

연습 문제

참새 생존 예측하기

이 연습 문제에서는 이전 연습 문제에서 만든 참새 생존 모델을 사용해 생존 확률을 예측해 보겠습니다.

glm() 모델에서 예측 확률을 얻기 위해 predict()(문서)를 호출할 때는 응답값을 원한다는 것을 반드시 지정해야 합니다:

predict(model, type = "response")

그렇지 않으면 로지스틱 회귀 모델에 대해 predict()는 확률이 아니라 사건의 예측 로그 오즈를 반환합니다.

또한 GainCurvePlot()(문서) 함수를 사용해 모델 예측으로부터 게인 곡선을 그립니다. 모델의 게인 곡선이 이상적(“wizard”) 게인 곡선에 가깝다면, 모델이 참새를 잘 정렬한 것입니다. 즉, 실제로 살아남은 참새일수록 생존 확률을 더 높게 예측했다는 뜻입니다. GainCurvePlot() 함수의 입력은 다음과 같습니다:

  • frame: 예측 열과 정답 열이 있는 데이터 프레임
  • xvar: 예측 값이 들어 있는 열 이름(문자열)
  • truthVar: 실제 결과가 들어 있는 열 이름(문자열)
  • title: 플롯 제목(문자열)

GainCurvePlot(frame, xvar, truthVar, title)

sparrow 데이터 프레임과 모델 sparrow_model은 이미 불러와져 있습니다.

지침

100 XP
  • 훈련 데이터에 대한 예측 값을 담은 pred라는 새 열을 sparrow에 추가하세요.
  • 예측의 게인 곡선을 그리기 위해 GainCurvePlot()을 호출하세요. 이 모델은 실제로 생존했는지 여부에 따라 참새를 잘 구분하나요?