1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python으로 설계하는 Machine Learning 워크플로

Connected

演習

기본 임계값 확인

이전 레슨에서 언급한 것처럼 DecisionTreeClassifier()가 기본 분류 임계값 0.5를 사용하는지 확인해 보려고 해요. 모든 분류기가 같은 임계값을 사용하는 건 좀 이상해 보이죠. 직접 확인해 봅시다! 학습이 완료된 결정 트리 분류기 clf와 학습/테스트 데이터 X_train, X_test, y_train, y_test가 미리 로드되어 있어요. 분류기의 .predict_proba() 메서드를 사용해 확률 점수를 먼저 추출해야 해요.

指示

100 XP
  • 미리 로드된 분류기 clf를 사용해 테스트 예제의 점수를 생성하세요.
  • 이제 그 점수에서 레이블을 추출하세요. 각 예제마다 단일 점수가 아니라 점수 쌍이 있으며, 두 번째 요소가 양성 클래스의 확률이라는 점을 기억하세요.
  • 이제 표준 .predict() 메서드를 사용해 테스트 데이터를 레이블링하세요.
  • 마지막으로, 앞에서 구한 예측값과 비교하세요. 동일한가요?