ComenzarEmpieza gratis

Errores más grandes, mayor penalización

Todos los errores son errores, pero no todos son igual de graves. A veces, los errores de predicción grandes son desproporcionadamente más perjudiciales que los pequeños.

Errores más grandes, mayor penalización: esa es una de las características del error cuadrático medio o RMSE. Eleva al cuadrado los errores grandes, lo que castiga a estos valores atípicos con más severidad que a los errores pequeños.

El RMSE puede calcularse con la siguiente fórmula, donde el squared_diff \(i\)-ésimo es el cuadrado del error \(i\)-ésimo.

$$RMSE = \sqrt{\frac{1}{n} \cdot \sum_{i=1} ^n i\text{th squared_diff}}$$

En este ejercicio, vas a calcular el RMSE de tus predicciones.

En tu espacio de trabajo tienes disponible el resultado del ejercicio anterior, test_enriched, los datos de prueba con una nueva columna .pred, que contiene las predicciones fuera de muestra del modelo.

Este ejercicio forma parte del curso

Machine Learning con modelos basados en árboles en R

Ver curso

Instrucciones del ejercicio

  • Calcula las diferencias componente a componente entre las predicciones y las calificaciones finales, elévalas al cuadrado y guárdalas como squared_diffs.
  • Usa la fórmula anterior para calcular el RMSE y guárdalo como rmse_manual.
  • Usa la función rmse() para calcular el error y guárdalo como rmse_auto.
  • Imprime rmse_manual y rmse_auto para comprobar que son iguales.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate the squared differences
squared_diffs <- (___ - ___)^___

# Compute the RMSE using the formula
rmse_manual <- ___(1 / ___ * ___)

# Compute the RMSE using a function
rmse_auto <- ___(___,
                 ___,
                 ___)

# Print both errors
___
___
Editar y ejecutar código