1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 Machine Learning을 활용한 CTR 예측

Connected

Exercise

베이스라인

적절한 베이스라인과 비교하여 분류기를 평가하는 것은 중요해요. 광고 클릭률과 같은 불균형 데이터셋에서는 다수 클래스를 항상 선택해도 높은 정확도가 쉽게 나올 수 있기 때문에 특히 더 그렇습니다. 이 연습 문제에서는 항상 다수 클래스(비클릭)를 예측하는 베이스라인 분류기를 모의로 만들어 그 혼동 행렬을 확인하고, 정밀도와 재현율이 어떻게 되는지 살펴보겠습니다.

X_train, y_train, X_test, y_test가 작업 공간에 준비되어 있어요. 또한 pandas는 pd, numpy는 np, sklearn도 사용할 수 있어요.

Instructions

100 XP
  • np.asarray()를 사용해 X_test와 길이가 같은 0으로 된 배열 y_pred를 만드세요.
  • 생성된 혼동 행렬을 출력하세요.
  • 정밀도와 재현율 점수를 구하세요.