Aplicando a métrica de Zhang
A fundadora da startup de ebooks voltou para contratar serviços adicionais de consultoria. Ela enviou uma lista de itemsets que está investigando e pediu que você verifique se algum deles contém itens dissociados. Quando terminar, ela solicitou que você adicione a métrica usada em uma coluna no DataFrame rules, que está disponível para você e atualmente contém as colunas antecedents e consequents.
Os itemsets estão disponíveis como uma lista de listas chamada itemsets. Cada lista contém o antecedente primeiro e o consequente em segundo. Você também tem acesso ao DataFrame books dos exercícios anteriores. Observe que a métrica de Zhang foi definida para você e está disponível como zhang(). Além disso, pandas está disponível como pd e numpy como np.
Este exercício faz parte do curso
Análise de Cesta de Compras em Python
Instruções do exercício
- Faça um loop por cada itemset em
itemsets. - Extraia as colunas de antecedente e consequente de
bookspara cada itemset. - Complete a expressão e acrescente o resultado à lista
zhangs_metric. - Imprima a métrica para cada itemset.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define an empty list for Zhang's metric
zhangs_metric = []
# Loop over lists in itemsets
for itemset in ____:
# Extract the antecedent and consequent columns
antecedent = books[itemset[0]]
consequent = ____[itemset[1]]
# Complete Zhang's metric and append it to the list
zhangs_metric.append(zhang(____, ____))
# Print results
rules['zhang'] = zhangs_metric
print(rules)