Definir a variável alvo
Aqui, você vai construir uma tabela dinâmica do pandas com clientes nas linhas, meses de faturamento nas colunas e a contagem de faturas como valores. Você usará o valor do último mês como variável alvo. As demais variáveis podem ser usadas como as chamadas variáveis defasadas (lagged features) no modelo. Você não vai usá-las agora, mas fica o convite para testar se adicionar essas variáveis melhora o desempenho do seu modelo além do que verá nos próximos exercícios.
As bibliotecas pandas e numpy foram carregadas como pd e np, respectivamente. O conjunto de dados online já foi importado para você.
Este exercício faz parte do curso
Machine Learning para Marketing em Python
Instruções do exercício
- Construa uma tabela dinâmica usando a função
pivot_table()contando as faturas. - Armazene o nome da coluna de vendas de novembro de 2011 como uma lista.
- Armazene o valor alvo como
Y.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Build a pivot table counting invoices for each customer monthly
cust_month_tx = pd.___(data=online, values='___',
index=['___'], columns=['___'],
aggfunc=pd.Series.nunique, fill_value=0)
# Store November 2011 data column name as a list
target = ['2011-___']
# Store target value as `Y`
Y = cust_month_tx[___]