Usando coordenadas paralelas para visualizar regras
Sua demonstração visual no exercício anterior convenceu a fundadora de que a fronteira entre suporte e confiança merece ser explorada mais a fundo. Ela agora sugere que você extraia uma parte dessa fronteira e a visualize. Como as regras que ficam na fronteira são fortes em relação às métricas mais comuns, ela argumenta que você deve simplesmente visualizar se uma regra existe, em vez da intensidade da regra segundo alguma métrica.
Você percebe que um gráfico de coordenadas paralelas é ideal para esses casos. Os dados foram importados para você como onehot. Além disso, apriori(), association_rules() e parallel_coordinates() foram importadas, e pandas está disponível como pd. A função rules_to_coordinates() foi definida e está disponível.
Este exercício faz parte do curso
Análise de Cesta de Compras em Python
Instruções do exercício
- Complete a instrução do algoritmo Apriori usando um suporte mínimo de 0,05.
- Calcule as regras de associação usando um limiar mínimo de confiança de 0,50. Isso é suficientemente alto para capturar exclusivamente pontos próximos à parte superior da fronteira suporte-confiança.
- Converta as regras em coordenadas.
- Plote as coordenadas usando
parallel_coordinates().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compute the frequent itemsets
frequent_itemsets = ____(onehot, min_support = ____,
use_colnames = True, max_len = 2)
# Compute rules from the frequent itemsets with the confidence metric
rules = association_rules(frequent_itemsets, metric = '____',
min_threshold = 0.50)
# Convert rules into coordinates suitable for use in a parallel coordinates plot
coords = rules_to_coordinates(____)
# Generate parallel coordinates plot
parallel_coordinates(____, 'rule')
plt.legend([])
plt.show()