Separando target e features
Para fazer uma previsão (neste caso, se uma pessoa colaboradora vai sair ou não), é preciso separar o conjunto de dados em dois componentes:
- a variável dependente ou target, que precisa ser prevista
- as variáveis independentes ou features, que serão usadas para fazer a previsão
Sua tarefa é separar o target e as features. Aqui, o target é o churn de colaboradores, e as features incluem todo o restante.
Lembrete: o conjunto de dados já foi modificado com a codificação de variáveis categóricas e criação de dummies.
pandas já foi importado como pd.
Este exercício faz parte do curso
HR Analytics: prevendo rotatividade de funcionários em Python
Instruções do exercício
- Defina o target e as features:
- Escolha a coluna da variável dependente (
churn) e defina-a comotarget. - Use
.drop()na colunachurnpara definir todo o restante comofeatures.
- Escolha a coluna da variável dependente (
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set the target and features
# Choose the dependent variable column (churn) and set it as target
target = data.____
# Drop column churn and set everything else as features
features = data.____("____",axis=1)