Calculando associação e dissociação
A biblioteca voltou a falar com você sobre sua recomendação de promover Harry Potter usando Twilight. Eles estão preocupados que os dois possam estar dissociados, o que poderia impactar negativamente a ação promocional. Eles pedem que você verifique se não é o caso.
Você imediatamente pensa na métrica de Zhang, que mede associação e dissociação de forma contínua. Associação é positiva e dissociação é negativa. Como nos exercícios anteriores, o DataFrame books já foi importado para você, junto com o numpy com o alias np. A métrica de Zhang é calculada da seguinte forma:
$$Zhang(A \rightarrow B) = $$ $$\frac{Support(A \& B) - Support(A) Support(B)}{ max[Support(AB) (1-Support(A)), Support(A)(Support(B)-Support(AB))]}$$
Este exercício faz parte do curso
Análise de Cesta de Compras em Python
Instruções do exercício
- Calcule o suporte de {Twilight} e o suporte de {Potter}.
- Calcule o suporte de {Twilight, Potter}.
- Complete a expressão do denominador.
- Calcule a métrica de Zhang para {Twilight} \(\rightarrow\) {Potter}.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compute the support of Twilight and Harry Potter
supportT = books['Twilight'].____
supportP = books['Potter'].____
# Compute the support of both books
supportTP = ____.mean()
# Complete the expressions for the numerator and denominator
numerator = supportTP - supportT*supportP
denominator = ___(supportTP*(1-supportT), supportT*(supportP-supportTP))
# Compute and print Zhang's metric
zhang = ____ / ____
print(zhang)