1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 statsmodels로 살펴보는 회귀 소개

Connected

연습 문제

혼동 행렬 계산하기

혼동 행렬(때로는 혼동 표라고도 함)은 범주형 반응 변수를 갖는 모델(예: 로지스틱 회귀)의 모든 성능 지표의 기반이 됩니다. 여기에는 실제 반응과 예측 반응의 각 조합에 대한 개수가 담겨 있습니다. 이 예시처럼 가능한 반응이 두 가지(이탈 또는 비이탈)인 경우, 총 네 가지 결과가 생깁니다.

  1. True positive: 고객이 실제로 이탈했고, 모델도 이탈로 예측했어요.
  2. False positive: 고객은 이탈하지 않았지만, 모델은 이탈로 예측했어요.
  3. True negative: 고객이 실제로 이탈하지 않았고, 모델도 비이탈로 예측했어요.
  4. False negative: 고객이 실제로 이탈했지만, 모델은 비이탈로 예측했어요.

churn와 mdl_churn_vs_relationship가 준비되어 있습니다.

지침

100 XP
  • 데이터셋의 has_churned 열을 서브셋팅해 실제 반응을 구하고 actual_response에 할당하세요.
  • 모델에서 "가장 가능성이 높은" 예측 반응을 구하고 predicted_response에 할당하세요.
  • actual_response와 predicted_response로부터 DataFrame을 만들고 outcomes에 할당하세요.
  • 혼동 행렬을 나타내도록 outcomes를 빈도 표로 출력하세요. 이 항목은 미리 작성되어 있습니다.