ComenzarEmpieza gratis

RMSE dentro de la muestra para regresión lineal en diamonds

Como viste en el vídeo, en el curso se incluye el conjunto de datos diamonds, un clásico del paquete ggplot2. Este conjunto contiene atributos físicos de diamantes y el precio al que se vendieron. Un reto interesante de modelado es predecir el precio del diamante a partir de sus atributos usando algo como una regresión lineal.

Recuerda que, para ajustar una regresión lineal, usas la función lm() con el siguiente formato:

mod <- lm(y ~ x, my_data)

Para hacer predicciones con mod sobre los datos originales, llamas a la función predict():

pred <- predict(mod, my_data)

Este ejercicio forma parte del curso

Machine Learning con caret en R

Ver curso

Instrucciones del ejercicio

  • Ajusta un modelo lineal sobre el conjunto diamonds para predecir price usando todas las demás variables como predictoras (es decir, price ~ .). Guarda el resultado en model.
  • Haz predicciones con model sobre el conjunto de datos original completo y guarda el resultado en p.
  • Calcula los errores usando la fórmula \(errors = predicted - actual\). Guarda el resultado en error.
  • Calcula el RMSE usando la fórmula que viste en el vídeo e imprímelo en la consola.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Fit lm model: model


# Predict on full data: p


# Compute errors: error


# Calculate RMSE
Editar y ejecutar código