Filtrado (subsetting)
Recuerda: la empresa quiere ampliar su negocio y ofrecer Hoppiness a nivel nacional. Por tanto, el modelo también debería funcionar con datos de tiendas nuevas. Una manera de comprobar cómo se comportará tu modelo con datos nuevos es entrenarlo primero con una parte de los datos y luego intentar predecir el resto.
Vas a crear un conjunto de entrenamiento dejando fuera la última compra registrada para cada cliente. Puedes hacerlo usando la función subset() sobre choice.data y seleccionando todas las observaciones cuya variable indicadora LASTPURCHASE sea igual a 0. Del mismo modo, crearás un conjunto de prueba seleccionando todas las observaciones cuya variable indicadora LASTPURCHASE sea igual a 1.
Este ejercicio forma parte del curso
Creación de modelos de respuesta en R
Instrucciones del ejercicio
- Deja fuera la última compra para crear un conjunto de entrenamiento. Usa la función
subset()sobrechoice.data. EspecificaLASTPURCHASE == 0como argumentosubset. Asigna el resultado atrain.data. - Crea un conjunto de prueba usando la función
subset()sobrechoice.data. EspecificaLASTPURCHASE == 1como argumentosubset. Asigna el resultado atest.data.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the training data
# Create the test data