ComenzarEmpieza gratis

Filtrado (subsetting)

Recuerda: la empresa quiere ampliar su negocio y ofrecer Hoppiness a nivel nacional. Por tanto, el modelo también debería funcionar con datos de tiendas nuevas. Una manera de comprobar cómo se comportará tu modelo con datos nuevos es entrenarlo primero con una parte de los datos y luego intentar predecir el resto.

Vas a crear un conjunto de entrenamiento dejando fuera la última compra registrada para cada cliente. Puedes hacerlo usando la función subset() sobre choice.data y seleccionando todas las observaciones cuya variable indicadora LASTPURCHASE sea igual a 0. Del mismo modo, crearás un conjunto de prueba seleccionando todas las observaciones cuya variable indicadora LASTPURCHASE sea igual a 1.

Este ejercicio forma parte del curso

Creación de modelos de respuesta en R

Ver curso

Instrucciones del ejercicio

  • Deja fuera la última compra para crear un conjunto de entrenamiento. Usa la función subset() sobre choice.data. Especifica LASTPURCHASE == 0 como argumento subset. Asigna el resultado a train.data.
  • Crea un conjunto de prueba usando la función subset() sobre choice.data. Especifica LASTPURCHASE == 1 como argumento subset. Asigna el resultado a test.data.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create the training data


# Create the test data
Editar y ejecutar código