Calcular o RMSE
Neste exercício, você vai calcular o RMSE do seu modelo de desemprego. Nos exercícios de código anteriores,
você adicionou duas colunas ao conjunto de dados unemployment:
- as previsões do modelo (coluna
predictions) - os resíduos entre as previsões e o resultado (coluna
residuals)
Você pode calcular o RMSE a partir de um vetor de resíduos, \(res\), como:
$$ RMSE = \sqrt{\operatorname{mean}(res^2)} $$
Você quer que o RMSE seja pequeno. Quão pequeno é "pequeno"? Uma heurística é comparar o RMSE ao desvio padrão do resultado. Com um bom modelo, o RMSE deve ser menor.
O data frame unemployment já foi carregado para você.
Este exercício faz parte do curso
Aprendizado Supervisionado em R: Regressão
Instruções do exercício
- Revise os dados
unemploymentdo exercício anterior. - Para conveniência, atribua a coluna
residualsdeunemploymentà variávelres. - Calcule o RMSE: eleve
resao quadrado, calcule a média e depois extraia a raiz quadrada. Atribua o resultado à variávelrmsee imprima.- Dica: você pode fazer isso em um único passo envolvendo a atribuição entre parênteses:
(rmse <- ___)
- Dica: você pode fazer isso em um único passo envolvendo a atribuição entre parênteses:
- Calcule o desvio padrão de
female_unemploymente atribua à variávelsd_unemployment. Imprima. Como o RMSE do modelo se compara ao desvio padrão dos dados?
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print a summary of unemployment
summary(unemployment)
# For convenience put the residuals in the variable res
res <- ___
# Calculate RMSE, assign it to the variable rmse and print it
(rmse <- ___)
# Calculate the standard deviation of female_unemployment and print it
(sd_unemployment <- ___)