ComenzarEmpieza gratis

Datos vistos vs. no vistos

Los modelos suelen tener mayor exactitud en observaciones que ya han visto. En el conjunto de datos de dulces, predecir la popularidad de Skittles probablemente tendrá mayor exactitud que predecir la popularidad de Andes Mints; Skittles está en el conjunto de datos y Andes Mints no.

Has creado un modelo basado en 50 dulces usando el conjunto de datos X_train y necesitas informar qué tan preciso es el modelo al predecir la popularidad de los 50 dulces con los que se construyó el modelo, y de los 35 dulces (X_test) que nunca ha visto. Usarás el error absoluto medio, mae(), como métrica de exactitud.

Este ejercicio forma parte del curso

Validación de modelos en Python

Ver curso

Instrucciones del ejercicio

  • Usando X_train y X_test como datos de entrada, crea arrays de predicciones con model.predict().
  • Calcula la exactitud del modelo tanto en datos que el modelo ha visto como en datos que no ha visto antes.
  • Usa las sentencias print para mostrar los datos vistos y no vistos.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# The model is fit using X_train and y_train
model.fit(X_train, y_train)

# Create vectors of predictions
train_predictions = model.predict(____)
test_predictions = model.predict(____)

# Train/Test Errors
train_error = mae(y_true=y_train, y_pred=____)
test_error = mae(y_true=y_test, y_pred=____)

# Print the accuracy for seen and unseen data
print("Model error on seen data: {0:.2f}.".format(____))
print("Model error on unseen data: {0:.2f}.".format(____))
Editar y ejecutar código