Errores más grandes, mayor penalización
Todos los errores son errores, pero no todos son igual de graves. A veces, los errores de predicción grandes son desproporcionadamente más perjudiciales que los pequeños.
Errores más grandes, mayor penalización: esa es una de las características del error cuadrático medio o RMSE. Eleva al cuadrado los errores grandes, lo que castiga a estos valores atípicos con más severidad que a los errores pequeños.
El RMSE puede calcularse con la siguiente fórmula, donde el squared_diff \(i\)-ésimo es el cuadrado del error \(i\)-ésimo.
$$RMSE = \sqrt{\frac{1}{n} \cdot \sum_{i=1} ^n i\text{th squared_diff}}$$
En este ejercicio, vas a calcular el RMSE de tus predicciones.
En tu espacio de trabajo tienes disponible el resultado del ejercicio anterior, test_enriched, los datos de prueba con una nueva columna .pred, que contiene las predicciones fuera de muestra del modelo.
Este ejercicio forma parte del curso
Machine Learning con modelos basados en árboles en R
Instrucciones del ejercicio
- Calcula las diferencias componente a componente entre las predicciones y las calificaciones finales, elévalas al cuadrado y guárdalas como
squared_diffs. - Usa la fórmula anterior para calcular el RMSE y guárdalo como
rmse_manual. - Usa la función
rmse()para calcular el error y guárdalo comormse_auto. - Imprime
rmse_manualyrmse_autopara comprobar que son iguales.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate the squared differences
squared_diffs <- (___ - ___)^___
# Compute the RMSE using the formula
rmse_manual <- ___(1 / ___ * ___)
# Compute the RMSE using a function
rmse_auto <- ___(___,
___,
___)
# Print both errors
___
___