Poda por confiança

Mais uma vez, você ficou indeciso: encontrou várias regras úteis, mas não consegue chegar a uma só. Pior ainda, as duas regras que você achou usam o mesmo conjunto de itens, apenas trocando antecedentes e consequentes. Você decide verificar se podar por outra métrica pode ajudar a reduzir tudo a uma única regra de associação.

Qual seria a métrica certa? Tanto o lift quanto o suporte são idênticos para todas as regras geradas a partir de um mesmo conjunto de itens, então você decide usar a confiança, que varia entre regras produzidas do mesmo conjunto. Observe que pandas está disponível como pd e que os dados de transações one-hot estão disponíveis como onehot. Além disso, apriori já foi importado de mlxtend.

Este exercício faz parte do curso

Análise de Cesta de Compras em Python

Instruções do exercício

Importe association_rules de mlxtend.
Complete a chamada do algoritmo apriori usando valor de suporte 0.0015 e comprimento máximo do conjunto de itens igual a 2.
Complete a chamada para as regras de associação usando confiança como métrica e valor de limiar de 0.5.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import the association rules function
____

# Compute frequent itemsets using the Apriori algorithm
frequent_itemsets = ____(onehot, ____, 
                            ____, use_colnames = True)

# Compute all association rules using confidence
rules = ____(frequent_itemsets, 
                            metric = "____", 
                         	min_threshold = ____)

# Print association rules
print(rules)

Editar e executar o código

Este exercício faz parte do curso

Análise de Cesta de Compras em Python

IntermediárioNível de habilidade

4.9+

Iniciar curso de graça

Neste capítulo, você vai aprender o básico de Análise de Cesta de Compras: regras de associação, métricas e poda. Depois, vai aplicar esses conceitos para ajudar um pequeno mercado a melhorar suas ações promocionais e a organização dos produtos.

Exercise 1: O que é Market Basket Analysis?Exercise 2: O básico de market basket analysis Exercise 3: Venda cruzada de produtos Exercise 4: Identificando regras de associação Exercise 5: Múltiplos antecedentes e consequentes Exercise 6: Preparando dados para análise de cesta de compras Exercise 7: Gerando regras de associação Exercise 8: A métrica mais simples Exercise 9: One-hot encoding de dados de transações Exercise 10: Calculando a métrica de suporte

As regras de associação mostram que dois ou mais itens estão relacionados. As métricas permitem quantificar a utilidade desses relacionamentos. Neste capítulo, você vai aplicar seis métricas para avaliar regras de associação: suporte, confiança, lift, convicção, alavancagem e a métrica de Zhang. Em seguida, você vai usar regras de associação e métricas para ajudar uma biblioteca e uma loja de e-books.

Exercise 1: Confiança e lift Exercise 2: Recomendando livros com suporte Exercise 3: Refinando o suporte com confiança Exercise 4: Refinando ainda mais com lift Exercise 5: Leverage e conviction Exercise 6: Lift versus leverage Exercise 7: Calculando convicção Exercise 8: Calculando conviction com uma função Exercise 9: Promovendo e-books com conviction Exercise 10: Associação e dissociação Exercise 11: Calculando associação e dissociação Exercise 12: Definindo a métrica de Zhang Exercise 13: Aplicando a métrica de Zhang Exercise 14: Regras avançadas Exercise 15: Filtrando por support e conviction Exercise 16: Usando filtragem com múltiplas métricas para fazer cross-promoção de livros

O problema fundamental da Análise de Cesta de Compras é determinar como transformar um grande volume de decisões de clientes em um pequeno conjunto de regras úteis. Esse processo normalmente começa com a aplicação do algoritmo Apriori e envolve o uso de estratégias adicionais, como poda e agregação. Neste capítulo, você vai aprender a usar esses métodos e, ao final, aplicá-los em exercícios nos quais você ajuda uma varejista a definir o layout de uma loja física e realizar promoções cruzadas de produtos.

Exercise 1: Agregação Exercise 2: Realizando agregação Exercise 3: Definindo uma função de agregação Exercise 4: O algoritmo Apriori Exercise 5: Poda e Apriori Exercise 6: Identificando conjuntos frequentes com Apriori Exercise 7: Selecionando um limite de suporte Exercise 8: Poda básica de resultados do Apriori Exercise 9: Gerando regras de associação Exercise 10: Poda com lift Exercise 11: Poda por confiança

Exercício atual

Exercise 12: Poda avançada de resultados do Apriori Exercise 13: Agregação e filtragem Exercise 14: Aplicando a regra de Zhang Exercise 15: Filtragem avançada com múltiplas métricas

Neste capítulo final, você vai aprender como visualizações são usadas para orientar o processo de poda e resumir os resultados finais, que normalmente assumem a forma de conjuntos de itens ou regras. Você vai dominar as três visualizações mais úteis — mapas de calor, gráficos de dispersão e gráficos de coordenadas paralelas — e aplicá-las para ajudar um serviço de streaming de filmes.

Exercise 1: Mapas de calor Exercise 2: Visualizando o suporte de itemsets Exercise 3: Heatmaps com lift Exercise 4: Interpretando mapas de calor Exercise 5: Gráficos de dispersão Exercise 6: Poda com gráficos de dispersão Exercise 7: Otimalidade da fronteira suporte-confiança Exercise 8: Gráfico de coordenadas paralelas Exercise 9: Usando coordenadas paralelas para visualizar regras Exercise 10: Aprimorando um gráfico de coordenadas paralelas Exercise 11: Parabéns!