ComeçarComece de graça

Calcular o RMSE

Neste exercício, você vai calcular o RMSE do seu modelo de desemprego. Nos exercícios de código anteriores, você adicionou duas colunas ao conjunto de dados unemployment:

  • as previsões do modelo (coluna predictions)
  • os resíduos entre as previsões e o resultado (coluna residuals)

Você pode calcular o RMSE a partir de um vetor de resíduos, \(res\), como:

$$ RMSE = \sqrt{\operatorname{mean}(res^2)} $$

Você quer que o RMSE seja pequeno. Quão pequeno é "pequeno"? Uma heurística é comparar o RMSE ao desvio padrão do resultado. Com um bom modelo, o RMSE deve ser menor.

O data frame unemployment já foi carregado para você.

Este exercício faz parte do curso

Aprendizado Supervisionado em R: Regressão

Ver curso

Instruções do exercício

  • Revise os dados unemployment do exercício anterior.
  • Para conveniência, atribua a coluna residuals de unemployment à variável res.
  • Calcule o RMSE: eleve res ao quadrado, calcule a média e depois extraia a raiz quadrada. Atribua o resultado à variável rmse e imprima.
    • Dica: você pode fazer isso em um único passo envolvendo a atribuição entre parênteses: (rmse <- ___)
  • Calcule o desvio padrão de female_unemployment e atribua à variável sd_unemployment. Imprima. Como o RMSE do modelo se compara ao desvio padrão dos dados?

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Print a summary of unemployment
summary(unemployment)

# For convenience put the residuals in the variable res
res <- ___

# Calculate RMSE, assign it to the variable rmse and print it
(rmse <- ___)

# Calculate the standard deviation of female_unemployment and print it
(sd_unemployment <- ___)
Editar e executar o código