Séparer les variables explicatives et la variable cible

Maintenant que vous avez scindé les données en apprentissage et test, il est temps d’effectuer la dernière étape avant d’ajuster le modèle : séparer les variables explicatives et la variable cible dans des jeux de données distincts. Vous utiliserez la liste des noms de colonnes qui a été chargée pour vous.

Le jeu de données principal est chargé sous telcom, puis scindé en apprentissage et test, chargés en pandas DataFrames dans train et test respectivement. Les listes target et custid contiennent les noms de la variable cible et de l’identifiant client, respectivement. Vous devrez créer la liste cols avec les noms des colonnes restantes. N’hésitez pas à explorer les jeux de données dans la console.

Cet exercice fait partie du cours

Machine Learning pour le marketing en Python

Afficher le cours

Instructions

Stockez les noms de colonnes de telcom dans une liste en excluant la variable cible et l’identifiant client.
Extrayez les variables explicatives et la cible pour l’apprentissage.
Extrayez les variables explicatives et la cible pour le test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Store column names from `telcom` excluding target variable and customer ID
cols = [col for col in ___.columns if col not in ___ + target]

# Extract training features
train_X = train[___]

# Extract training target
train_Y = train[___]

# Extract testing features
test_X = test[___]

# Extract testing target
test_Y = test[___]

Modifier et exécuter le code