ComeçarComece de graça

Definir a variável alvo

Aqui, você vai construir uma tabela dinâmica do pandas com clientes nas linhas, meses de faturamento nas colunas e a contagem de faturas como valores. Você usará o valor do último mês como variável alvo. As demais variáveis podem ser usadas como as chamadas variáveis defasadas (lagged features) no modelo. Você não vai usá-las agora, mas fica o convite para testar se adicionar essas variáveis melhora o desempenho do seu modelo além do que verá nos próximos exercícios.

As bibliotecas pandas e numpy foram carregadas como pd e np, respectivamente. O conjunto de dados online já foi importado para você.

Este exercício faz parte do curso

Machine Learning para Marketing em Python

Ver curso

Instruções do exercício

  • Construa uma tabela dinâmica usando a função pivot_table() contando as faturas.
  • Armazene o nome da coluna de vendas de novembro de 2011 como uma lista.
  • Armazene o valor alvo como Y.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Build a pivot table counting invoices for each customer monthly
cust_month_tx = pd.___(data=online, values='___',
                               index=['___'], columns=['___'],
                               aggfunc=pd.Series.nunique, fill_value=0)

# Store November 2011 data column name as a list
target = ['2011-___']

# Store target value as `Y`
Y = cust_month_tx[___]
Editar e executar o código