Erros maiores, penalidade maior
Todo erro está errado, mas nem todos são igualmente graves. Às vezes, erros de previsão grandes são desproporcionalmente mais prejudiciais do que erros pequenos.
Erros maiores, penalidade maior — essa é uma das características do root mean squared error, ou RMSE. Ele eleva os erros ao quadrado, o que pune valores atípicos grandes mais severamente do que erros menores.
O RMSE pode ser calculado usando a fórmula a seguir, em que o squared_diff-ésimo do \(i\) é o quadrado do erro \(i\)-ésimo.
$$RMSE = \sqrt{\frac{1}{n} \cdot \sum_{i=1} ^n i\text{th squared_diff}}$$
Neste exercício, você vai calcular o RMSE das suas previsões.
Está disponível no seu workspace o resultado do último exercício, test_enriched, os dados de teste com uma nova coluna .pred, as previsões out-of-sample do modelo.
Este exercício faz parte do curso
Machine Learning com modelos baseados em árvores em R
Instruções do exercício
- Calcule as diferenças componente a componente entre as previsões e as notas finais, eleve ao quadrado e salve como
squared_diffs. - Use a fórmula acima para calcular o RMSE e salve como
rmse_manual. - Use a função
rmse()para calcular o erro e salve comormse_auto. - Imprima
rmse_manualermse_autopara verificar se são iguais.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the squared differences
squared_diffs <- (___ - ___)^___
# Compute the RMSE using the formula
rmse_manual <- ___(1 / ___ * ___)
# Compute the RMSE using a function
rmse_auto <- ___(___,
___,
___)
# Print both errors
___
___