혼동 행렬

scikit-learn의 confusion_matrix() 함수를 사용하면 분류기의 혼동 행렬을 손쉽게 만들어 성능을 더 정교하게 이해할 수 있어요. 이 함수는 두 개의 인수를 받습니다: 테스트 세트의 실제 레이블 y_test와 예측 레이블.

이전 연습 문제에서 만든 Random Forest 분류기의 예측 레이블은 y_pred에 저장되어 있으며, 아래와 같이 계산했어요:

y_pred = clf.predict(X_test)

중요한 참고 사항: 기본적으로 sklearn은 혼동 행렬을 다음과 같이 계산합니다:

Screenshot 2019-05-13 05.59.04.png

축의 배치가 영상에서 보신 것과 반대라는 점에 유의하세요. 지표 자체는 동일하지만, 표를 해석할 때 이 점을 꼭 기억하시기 바랍니다.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}연습 문제