1. 학습
  2. /
  3. 강의
  4. /
  5. 마케팅 애널리틱스: Python으로 고객 이탈 예측하기

Connected

연습 문제

혼동 행렬

scikit-learn의 confusion_matrix() 함수를 사용하면 분류기의 혼동 행렬을 손쉽게 만들어 성능을 더 정교하게 이해할 수 있어요. 이 함수는 두 개의 인수를 받습니다: 테스트 세트의 실제 레이블 y_test와 예측 레이블.

이전 연습 문제에서 만든 Random Forest 분류기의 예측 레이블은 y_pred에 저장되어 있으며, 아래와 같이 계산했어요:

y_pred = clf.predict(X_test)

중요한 참고 사항: 기본적으로 sklearn은 혼동 행렬을 다음과 같이 계산합니다:

Screenshot 2019-05-13 05.59.04.png

축의 배치가 영상에서 보신 것과 반대라는 점에 유의하세요. 지표 자체는 동일하지만, 표를 해석할 때 이 점을 꼭 기억하시기 바랍니다.

지침 1/3

undefined XP
    1
    2
    3
  • sklearn.metrics에서 confusion_matrix를 가져오세요.