ComeçarComece de graça

RMSE in-sample para regressão linear em diamonds

Como você viu no vídeo, o curso inclui o conjunto de dados diamonds, um clássico do pacote ggplot2. O conjunto de dados contém atributos físicos de diamantes e o preço pelo qual foram vendidos. Um desafio interessante de modelagem é prever o preço do diamante com base em seus atributos usando algo como uma regressão linear.

Lembre-se de que, para ajustar uma regressão linear, você usa a função lm() no seguinte formato:

mod <- lm(y ~ x, my_data)

Para fazer previsões com mod nos dados originais, você chama a função predict():

pred <- predict(mod, my_data)

Este exercício faz parte do curso

Machine Learning com caret em R

Ver curso

Instruções do exercício

  • Ajuste um modelo linear no conjunto diamonds prevendo price usando todas as outras variáveis como preditoras (ou seja, price ~ .). Salve o resultado em model.
  • Faça previsões usando model em todo o conjunto de dados original e salve o resultado em p.
  • Calcule os erros usando a fórmula \(errors = predicted - actual\). Salve o resultado em error.
  • Calcule o RMSE usando a fórmula que você aprendeu no vídeo e imprima no console.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Fit lm model: model


# Predict on full data: p


# Compute errors: error


# Calculate RMSE
Editar e executar o código