ComeçarComece de graça

Separe colunas numéricas e categóricas

No último exercício, você explorou as características do conjunto de dados e está pronto para fazer algum pré-processamento. Agora, você vai separar variáveis categóricas e numéricas do DataFrame telco_raw usando um limite personalizado para o número de valores únicos (categóricas vs. numéricas). O módulo pandas já foi carregado como pd.

O conjunto de dados bruto de churn em telecom, telco_raw, já foi carregado como um DataFrame do pandas. Você pode se familiarizar com o conjunto explorando-o no console.

Este exercício faz parte do curso

Machine Learning para Marketing em Python

Ver curso

Instruções do exercício

  • Armazene os nomes das colunas customerID e Churn.
  • Atribua a categorical os nomes das colunas que têm menos de 5 valores únicos.
  • Remova target da lista.
  • Atribua a numerical todos os nomes de colunas que não estão em custid, target e categorical.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Store customerID and Churn column names
custid = ['___']
target = ['___']

# Store categorical column names
categorical = telco_raw.___()[telco_raw.nunique() < ___].keys().tolist()

# Remove target from the list of categorical variables
categorical.remove(___[0])

# Store numerical column names
numerical = [x for x in telco_raw.___ if x not in custid + ___ + categorical]
Editar e executar o código