RMSE dentro de la muestra para regresión lineal en diamonds
Como viste en el vídeo, en el curso se incluye el conjunto de datos diamonds, un clásico del paquete ggplot2. Este conjunto contiene atributos físicos de diamantes y el precio al que se vendieron. Un reto interesante de modelado es predecir el precio del diamante a partir de sus atributos usando algo como una regresión lineal.
Recuerda que, para ajustar una regresión lineal, usas la función lm() con el siguiente formato:
mod <- lm(y ~ x, my_data)
Para hacer predicciones con mod sobre los datos originales, llamas a la función predict():
pred <- predict(mod, my_data)
Este ejercicio forma parte del curso
Machine Learning con caret en R
Instrucciones del ejercicio
- Ajusta un modelo lineal sobre el conjunto
diamondspara predecirpriceusando todas las demás variables como predictoras (es decir,price ~ .). Guarda el resultado enmodel. - Haz predicciones con
modelsobre el conjunto de datos original completo y guarda el resultado enp. - Calcula los errores usando la fórmula \(errors = predicted - actual\). Guarda el resultado en
error. - Calcula el RMSE usando la fórmula que viste en el vídeo e imprímelo en la consola.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Fit lm model: model
# Predict on full data: p
# Compute errors: error
# Calculate RMSE