Desempenho in-sample
É muito importante saber se seu modelo de regressão é útil ou não. Um modelo útil pode ser aquele que captura bem a estrutura do seu conjunto de treinamento. Uma forma de avaliar esse desempenho in-sample é prever nos dados de treinamento e calcular o erro absoluto médio de todos os pontos previstos.
Neste exercício, você vai avaliar suas previsões in-sample usando MAE (mean absolute error, ou erro absoluto médio). O MAE indica aproximadamente quão distante as previsões estão dos valores verdadeiros.
Ele é calculado usando a fórmula a seguir, em que \(n\) é o número de previsões feitas:
$$MAE = \frac{1}{n} \cdot \sum_{i=1}^n \text{absolute value of the }i\text{th error}$$
Está disponível no seu ambiente o seu model, a árvore de regressão que você construiu nos exercícios anteriores.
Este exercício faz parte do curso
Machine Learning com modelos baseados em árvores em R
Instruções do exercício
- Crie
in_sample_predictionsusandomodelpara prever no tibblechocolate_train. - Calcule um vetor
abs_diffsque contenha as diferenças absolutas entre as previsões in-sample e as notas verdadeiras. - Calcule o erro absoluto médio de acordo com a fórmula acima.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Predict using the training set
in_sample_predictions <- predict(model,
___)
# Calculate the vector of absolute differences
abs_diffs <- ___(__$___ - ___$___)
# Calculate the mean absolute error
1 / ___ * ___