1. 학습
  2. /
  3. 강의
  4. /
  5. Python의 statsmodels로 배우는 중급 회귀

Connected

연습 문제

Confusion matrix

반응 변수가 이탈처럼 두 가지 결과만 가질 때, 모델의 성과는 "고객이 실제로 이탈한 사례를 모델이 얼마나 정확히 예측했는가?"와 "고객이 실제로 이탈하지 않은 사례를 모델이 얼마나 정확히 예측했는가?"로 평가할 수 있어요. 이는 혼동 행렬(confusion matrix)을 만들고 그에 대한 요약 지표를 계산하면 확인할 수 있습니다.

다음 정의를 기억해 주세요.

Accuracy는 정답으로 예측한 비율입니다. $$ \text{accuracy} = \frac{TN + TP}{TN + FN + FP + TP} $$

Sensitivity는 실제로 참인 관측치 중에서 모델이 참으로 올바르게 예측한 비율입니다. $$ \text{sensitivity} = \frac{TP}{TP + FN} $$

Specificity는 실제로 거짓인 관측치 중에서 모델이 거짓으로 올바르게 예측한 비율입니다. $$ \text{specificity} = \frac{TN}{TN + FP} $$

churn과 mdl_churn_vs_both_inter가 제공됩니다.

지침 1/2

undefined XP
    1
    2
  • 혼동 행렬 conf_matrix를 생성하세요.