Separa las variables predictoras y la variable objetivo
Ahora que has dividido los datos en entrenamiento y prueba, toca realizar el último paso antes de ajustar el modelo: separar las variables predictoras y la variable objetivo en conjuntos de datos distintos. Usarás la lista de nombres de columnas que ya se ha cargado por ti.
El conjunto de datos principal está cargado como telcom, y se ha dividido en conjuntos de entrenamiento y prueba que están disponibles como DataFrames de pandas en train y test, respectivamente. Las listas target y custid contienen los nombres de la variable objetivo y del ID de cliente, respectivamente. Tendrás que crear la lista cols con los nombres de las columnas restantes. Puedes explorar los conjuntos de datos en la consola.
Este ejercicio forma parte del curso
Machine Learning para marketing en Python
Instrucciones del ejercicio
- Guarda en una lista los nombres de columna de
telcomexcluyendo la variable objetivo y el ID de cliente. - Extrae las variables predictoras y la variable objetivo de entrenamiento.
- Extrae las variables predictoras y la variable objetivo de prueba.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Store column names from `telcom` excluding target variable and customer ID
cols = [col for col in ___.columns if col not in ___ + target]
# Extract training features
train_X = train[___]
# Extract training target
train_Y = train[___]
# Extract testing features
test_X = test[___]
# Extract testing target
test_Y = test[___]