Realizando agregação
Depois de concluir pequenos trabalhos de consultoria para uma biblioteca e uma loja de ebooks, você finalmente recebeu seu primeiro grande projeto de market basket analysis: orientar um e-commerce de presentes criativos sobre promoções cruzadas. Como o varejista nunca contratou um cientista de dados antes, ele quer que você comece o projeto explorando seus dados de transações. Ele pediu que você realize a agregação para todos os signs no conjunto de dados e também calcule o suporte dessa categoria. Observe que pandas já foi importado como pd. Além disso, os dados foram importados no formato one-hot encoded como onehot.
Este exercício faz parte do curso
Análise de Cesta de Compras em Python
Instruções do exercício
- Selecione o subconjunto de colunas do DataFrame que contêm a string
sign. - Imprima o suporte para
signs.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Select the column headers for sign items
sign_headers = [i for i in onehot.columns if i.lower().find('sign')>=0]
# Select columns of sign items using sign_headers
sign_columns = onehot[____]
# Perform aggregation of sign items into sign category
signs = sign_columns.sum(axis = 1) >= 1.0
# Print support for signs
print('Share of Signs: %.2f' % ____.mean())