1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Python으로 Kaggle 대회 공략하기

Connected

Exercises

대회 평가지표 정의하기

Competition metric은 Kaggle에서 제출물을 평가할 때 사용하는 지표예요. 또한 로컬 검증 세트에서 서로 다른 모델의 성능을 비교할 때도 필요합니다.

이번에는 sklearn.metrics에 없는 경우를 대비해, 몇 가지 대회 지표를 직접 구현해 볼 거예요.

구체적으로 다음을 정의합니다:

  • 회귀 문제의 평균제곱오차(Mean Squared Error, MSE): $$MSE = \frac{1}{N}\sum_{i=1}^{N}{(y_i - \hat{y}_i)^2}$$

  • 이진 분류 문제의 로그 손실(Logarithmic Loss, LogLoss): $$LogLoss = -\frac{1}{N}\sum_{i=1}^{N}{(y_i\ln p_i + (1-y_i)\ln (1-p_i))}$$

คำแนะนำ 1 / 2

undefined XP
  • 1
    • numpy를 사용해 MSE 지표를 정의하세요. 함수 입력으로는 실제 값 y_true와 예측 값 y_pred 배열이 주어집니다.
  • 2
    • numpy를 사용해 LogLoss 지표를 정의하세요. 입력으로는 실제 클래스 y_true와 예측 확률 prob_pred가 주어집니다.