Rendimiento in-sample
Es muy importante saber si tu modelo de regresión es útil o no. Un modelo útil puede ser aquel que capta bien la estructura de tu conjunto de entrenamiento. Una forma de evaluar este rendimiento in-sample es predecir sobre los datos de entrenamiento y calcular el error absoluto medio de todos los puntos predichos.
En este ejercicio, evaluarás tus predicciones in-sample usando MAE (mean absolute error). El MAE te indica aproximadamente a qué distancia están las predicciones de los valores reales.
Se calcula con la siguiente fórmula, donde \(n\) es el número de predicciones realizadas:
$$MAE = \frac{1}{n} \cdot \sum_{i=1}^n \text{valor absoluto del error }i\text{-ésimo}$$
En tu espacio de trabajo tienes disponible tu model, el árbol de regresión que construiste en los ejercicios anteriores.
Este ejercicio forma parte del curso
Machine Learning con modelos basados en árboles en R
Instrucciones del ejercicio
- Crea
in_sample_predictionsusandomodelpara predecir sobre el tibblechocolate_train. - Calcula un vector
abs_diffsque contenga las diferencias absolutas entre las predicciones in-sample y las calificaciones reales. - Calcula el error absoluto medio según la fórmula anterior.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Predict using the training set
in_sample_predictions <- predict(model,
___)
# Calculate the vector of absolute differences
abs_diffs <- ___(__$___ - ___$___)
# Calculate the mean absolute error
1 / ___ * ___