Definindo uma função de agregação
Surpreso com a alta participação de itens de placas em seu estoque, o varejista decide que faz sentido fazer mais agregações por diferentes categorias para explorar melhor os dados. Isso parece trivial para você, mas o varejista nunca conseguiu realizar nem uma análise descritiva básica de suas transações e itens.
O varejista pede que você faça a agregação para as categorias candles, bags e boxes. Para simplificar a tarefa, você decide escrever uma função. Ela receberá uma string que contém a categoria de um item. Em seguida, ela produzirá um DataFrame que indica se cada transação inclui itens dessa categoria. Observe que pandas já foi importado como pd. Além disso, os dados foram importados no formato one-hot encoded como onehot.
Este exercício faz parte do curso
Análise de Cesta de Compras em Python
Instruções do exercício
- Complete a list comprehension que extrai um subconjunto dos nomes de colunas.
- Selecione as colunas do item que você deseja agregar.
- Realize a agregação usando a função
aggregate()para bags, boxes e candles usando as stringsbag,boxecandle.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def aggregate(item):
# Select the column headers for sign items in onehot
item_headers = [i for i in ____.columns if i.lower().find(item)>=0]
# Select columns of sign items
item_columns = onehot[____]
# Return category of aggregated items
return item_columns.sum(axis = 1) >= 1.0
# Aggregate items for the bags, boxes, and candles categories
bags = aggregate('bag')
boxes = aggregate('____')
candles = ____