RMSE in-sample para regressão linear em diamonds
Como você viu no vídeo, o curso inclui o conjunto de dados diamonds, um clássico do pacote ggplot2. O conjunto de dados contém atributos físicos de diamantes e o preço pelo qual foram vendidos. Um desafio interessante de modelagem é prever o preço do diamante com base em seus atributos usando algo como uma regressão linear.
Lembre-se de que, para ajustar uma regressão linear, você usa a função lm() no seguinte formato:
mod <- lm(y ~ x, my_data)
Para fazer previsões com mod nos dados originais, você chama a função predict():
pred <- predict(mod, my_data)
Este exercício faz parte do curso
Machine Learning com caret em R
Instruções do exercício
- Ajuste um modelo linear no conjunto
diamondsprevendopriceusando todas as outras variáveis como preditoras (ou seja,price ~ .). Salve o resultado emmodel. - Faça previsões usando
modelem todo o conjunto de dados original e salve o resultado emp. - Calcule os erros usando a fórmula \(errors = predicted - actual\). Salve o resultado em
error. - Calcule o RMSE usando a fórmula que você aprendeu no vídeo e imprima no console.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Fit lm model: model
# Predict on full data: p
# Compute errors: error
# Calculate RMSE