1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで挑むKaggleコンペティション

Connected

演習

コンペティションの評価指標を定義する

コンペティションの評価指標は、Kaggle があなたの提出物を評価するために使います。さらに、ローカルの検証用データセットで各モデルの性能を測る必要もあります。

ここでは、sklearn.metrics に存在しない場合に備えて、いくつかのコンペティション指標を手動で実装してみましょう。

具体的には、次を定義します。

  • 回帰問題の平均二乗誤差 (MSE): $$MSE = \frac{1}{N}\sum_{i=1}^{N}{(y_i - \hat{y}_i)^2}$$

  • 二値分類問題の対数損失 (LogLoss): $$LogLoss = -\frac{1}{N}\sum_{i=1}^{N}{(y_i\ln p_i + (1-y_i)\ln (1-p_i))}$$

指示1 / 2

undefined XP
  • 1
    • numpy を使って MSE を定義します。関数の入力として、正解の配列 y_true と予測の配列 y_pred が与えられます。
  • 2
    • numpy を使って LogLoss を定義します。入力として、正解ラベル y_true と予測確率 prob_pred が与えられます。