Filtragem avançada com múltiplas métricas

Anteriormente, usamos dados de uma loja online de presentes criativos para encontrar antecedentes que pudessem ser usados para promover um consequente específico. Como o conjunto de regras potenciais era grande, tivemos que recorrer ao algoritmo Apriori e à filtragem por múltiplas métricas para reduzi-lo. Neste exercício, vamos analisar o conjunto completo de regras e encontrar uma regra útil, em vez de mirar um antecedente específico.

Observe que os dados foram carregados, pré-processados e codificados em one-hot, e estão disponíveis como onehot. Além disso, apriori() e association_rules() foram importadas de mlxtend. Neste exercício, você aplicará o algoritmo Apriori para identificar conjuntos frequentes de itens. Em seguida, você recuperará o conjunto de regras de associação a partir desses conjuntos e aplicará filtragem por múltiplas métricas.

Este exercício faz parte do curso

Análise de Cesta de Compras em Python

Instruções do exercício

Aplique o algoritmo Apriori aos itemsets codificados em one-hot com um limite mínimo de suporte de 0,001.
Extraia as regras de associação usando um limite mínimo de suporte de 0,001.
Defina antecedent_support em 0,002 e consequent_support em 0,01.
Defina confidence como maior que 0,60 e lift como maior que 2,50.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Apply the Apriori algorithm with a minimum support threshold of 0.001
frequent_itemsets = ____(onehot, min_support = ____, use_colnames = True)

# Recover association rules using a minium support threshold of 0.001
rules = ____(frequent_itemsets, metric = '____', min_threshold = 0.001)

# Apply a 0.002 antecedent support threshold, 0.60 confidence threshold, and 2.50 lift threshold
filtered_rules = rules[(rules['antecedent support'] > ____) &
						(____['consequent support'] > 0.01) &
						(rules['____'] > ____) &
						(____ > 2.50)]

# Print remaining rule
print(filtered_rules[['antecedents','consequents']])

Editar e executar o código

Este exercício faz parte do curso

Análise de Cesta de Compras em Python

IntermediárioNível de habilidade

4.9+

Iniciar curso de graça

Neste capítulo, você vai aprender o básico de Análise de Cesta de Compras: regras de associação, métricas e poda. Depois, vai aplicar esses conceitos para ajudar um pequeno mercado a melhorar suas ações promocionais e a organização dos produtos.

Exercise 1: O que é Market Basket Analysis?Exercise 2: O básico de market basket analysis Exercise 3: Venda cruzada de produtos Exercise 4: Identificando regras de associação Exercise 5: Múltiplos antecedentes e consequentes Exercise 6: Preparando dados para análise de cesta de compras Exercise 7: Gerando regras de associação Exercise 8: A métrica mais simples Exercise 9: One-hot encoding de dados de transações Exercise 10: Calculando a métrica de suporte

As regras de associação mostram que dois ou mais itens estão relacionados. As métricas permitem quantificar a utilidade desses relacionamentos. Neste capítulo, você vai aplicar seis métricas para avaliar regras de associação: suporte, confiança, lift, convicção, alavancagem e a métrica de Zhang. Em seguida, você vai usar regras de associação e métricas para ajudar uma biblioteca e uma loja de e-books.

Exercise 1: Confiança e lift Exercise 2: Recomendando livros com suporte Exercise 3: Refinando o suporte com confiança Exercise 4: Refinando ainda mais com lift Exercise 5: Leverage e conviction Exercise 6: Lift versus leverage Exercise 7: Calculando convicção Exercise 8: Calculando conviction com uma função Exercise 9: Promovendo e-books com conviction Exercise 10: Associação e dissociação Exercise 11: Calculando associação e dissociação Exercise 12: Definindo a métrica de Zhang Exercise 13: Aplicando a métrica de Zhang Exercise 14: Regras avançadas Exercise 15: Filtrando por support e conviction Exercise 16: Usando filtragem com múltiplas métricas para fazer cross-promoção de livros

O problema fundamental da Análise de Cesta de Compras é determinar como transformar um grande volume de decisões de clientes em um pequeno conjunto de regras úteis. Esse processo normalmente começa com a aplicação do algoritmo Apriori e envolve o uso de estratégias adicionais, como poda e agregação. Neste capítulo, você vai aprender a usar esses métodos e, ao final, aplicá-los em exercícios nos quais você ajuda uma varejista a definir o layout de uma loja física e realizar promoções cruzadas de produtos.

Exercise 1: Agregação Exercise 2: Realizando agregação Exercise 3: Definindo uma função de agregação Exercise 4: O algoritmo Apriori Exercise 5: Poda e Apriori Exercise 6: Identificando conjuntos frequentes com Apriori Exercise 7: Selecionando um limite de suporte Exercise 8: Poda básica de resultados do Apriori Exercise 9: Gerando regras de associação Exercise 10: Poda com lift Exercise 11: Poda por confiança Exercise 12: Poda avançada de resultados do Apriori Exercise 13: Agregação e filtragem Exercise 14: Aplicando a regra de Zhang Exercise 15: Filtragem avançada com múltiplas métricas

Exercício atual

Neste capítulo final, você vai aprender como visualizações são usadas para orientar o processo de poda e resumir os resultados finais, que normalmente assumem a forma de conjuntos de itens ou regras. Você vai dominar as três visualizações mais úteis — mapas de calor, gráficos de dispersão e gráficos de coordenadas paralelas — e aplicá-las para ajudar um serviço de streaming de filmes.

Exercise 1: Mapas de calor Exercise 2: Visualizando o suporte de itemsets Exercise 3: Heatmaps com lift Exercise 4: Interpretando mapas de calor Exercise 5: Gráficos de dispersão Exercise 6: Poda com gráficos de dispersão Exercise 7: Otimalidade da fronteira suporte-confiança Exercise 8: Gráfico de coordenadas paralelas Exercise 9: Usando coordenadas paralelas para visualizar regras Exercise 10: Aprimorando um gráfico de coordenadas paralelas Exercise 11: Parabéns!