Separar features e variável alvo
Agora que você dividiu os dados em treino e teste, é hora de fazer a etapa final antes de ajustar o modelo: separar as features e a variável alvo em conjuntos de dados diferentes. Você usará a lista de nomes de colunas que já foi carregada para você.
O conjunto de dados principal está carregado como telcom e dividido em treino e teste, carregados como DataFrames do pandas em train e test, respectivamente. As listas target e custid contêm os nomes da variável alvo e do ID do cliente, respectivamente. Você precisará criar a lista cols com os nomes das colunas restantes. Fique à vontade para explorar os conjuntos de dados no console.
Este exercício faz parte do curso
Machine Learning para Marketing em Python
Instruções do exercício
- Armazene os nomes das colunas de
telcomem uma lista, excluindo a variável alvo e o nome do ID do cliente. - Extraia as features e o alvo do treino.
- Extraia as features e o alvo do teste.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Store column names from `telcom` excluding target variable and customer ID
cols = [col for col in ___.columns if col not in ___ + target]
# Extract training features
train_X = train[___]
# Extract training target
train_Y = train[___]
# Extract testing features
test_X = test[___]
# Extract testing target
test_Y = test[___]