ComeçarComece de graça

Dados vistos vs. não vistos

Modelos tendem a ter maior acurácia em observações que já viram antes. No conjunto de dados de doces, prever a popularidade de Skittles provavelmente será mais preciso do que prever a popularidade de Andes Mints; Skittles está no conjunto de dados, enquanto Andes Mints não está.

Você construiu um modelo com base em 50 doces usando o conjunto X_train e precisa reportar quão preciso o modelo é ao prever a popularidade dos 50 doces nos quais foi treinado, e dos 35 doces (X_test) que ele nunca viu. Você usará o erro absoluto médio, mae(), como métrica de acurácia.

Este exercício faz parte do curso

Validação de Modelos em Python

Ver curso

Instruções do exercício

  • Usando X_train e X_test como dados de entrada, crie vetores de previsões com model.predict().
  • Calcule a acurácia do modelo tanto em dados que ele já viu quanto em dados que ele nunca viu.
  • Use os comandos de impressão para mostrar os resultados de dados vistos e não vistos.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# The model is fit using X_train and y_train
model.fit(X_train, y_train)

# Create vectors of predictions
train_predictions = model.predict(____)
test_predictions = model.predict(____)

# Train/Test Errors
train_error = mae(y_true=y_train, y_pred=____)
test_error = mae(y_true=y_test, y_pred=____)

# Print the accuracy for seen and unseen data
print("Model error on seen data: {0:.2f}.".format(____))
print("Model error on unseen data: {0:.2f}.".format(____))
Editar e executar o código