Dados vistos vs. não vistos
Modelos tendem a ter maior acurácia em observações que já viram antes. No conjunto de dados de doces, prever a popularidade de Skittles provavelmente será mais preciso do que prever a popularidade de Andes Mints; Skittles está no conjunto de dados, enquanto Andes Mints não está.
Você construiu um modelo com base em 50 doces usando o conjunto X_train e precisa reportar quão preciso o modelo é ao prever a popularidade dos 50 doces nos quais foi treinado, e dos 35 doces (X_test) que ele nunca viu. Você usará o erro absoluto médio, mae(), como métrica de acurácia.
Este exercício faz parte do curso
Validação de Modelos em Python
Instruções do exercício
- Usando
X_traineX_testcomo dados de entrada, crie vetores de previsões commodel.predict(). - Calcule a acurácia do modelo tanto em dados que ele já viu quanto em dados que ele nunca viu.
- Use os comandos de impressão para mostrar os resultados de dados vistos e não vistos.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# The model is fit using X_train and y_train
model.fit(X_train, y_train)
# Create vectors of predictions
train_predictions = model.predict(____)
test_predictions = model.predict(____)
# Train/Test Errors
train_error = mae(y_true=y_train, y_pred=____)
test_error = mae(y_true=y_test, y_pred=____)
# Print the accuracy for seen and unseen data
print("Model error on seen data: {0:.2f}.".format(____))
print("Model error on unseen data: {0:.2f}.".format(____))