Defina uma métrica de competição
A métrica de competição é usada pelo Kaggle para avaliar suas submissões. Além disso, você também precisa medir o desempenho de diferentes modelos em um conjunto de validação local.
Por enquanto, seu objetivo é implementar manualmente algumas métricas de competição caso elas não estejam disponíveis em sklearn.metrics.
Em particular, você vai definir:
Mean Squared Error (MSE) para problemas de regressão: $$MSE = \frac{1}{N}\sum_{i=1}^{N}{(y_i - \hat{y}_i)^2}$$
Logarithmic Loss (LogLoss) para problemas de classificação binária: $$LogLoss = -\frac{1}{N}\sum_{i=1}^{N}{(y_i\ln p_i + (1-y_i)\ln (1-p_i))}$$
Este exercício faz parte do curso
Vencendo uma competição do Kaggle em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
import numpy as np
# Import MSE from sklearn
from sklearn.metrics import mean_squared_error
# Define your own MSE function
def own_mse(y_true, y_pred):
# Raise differences to the power of 2
squares = np.____(y_true - y_pred, 2)
# Find mean over all observations
err = np.____(squares)
return err
print('Sklearn MSE: {:.5f}. '.format(mean_squared_error(y_regression_true, y_regression_pred)))
print('Your MSE: {:.5f}. '.format(own_mse(y_regression_true, y_regression_pred)))