ComeçarComece de graça

Calculando associação e dissociação

A biblioteca voltou a falar com você sobre sua recomendação de promover Harry Potter usando Twilight. Eles estão preocupados que os dois possam estar dissociados, o que poderia impactar negativamente a ação promocional. Eles pedem que você verifique se não é o caso.

Você imediatamente pensa na métrica de Zhang, que mede associação e dissociação de forma contínua. Associação é positiva e dissociação é negativa. Como nos exercícios anteriores, o DataFrame books já foi importado para você, junto com o numpy com o alias np. A métrica de Zhang é calculada da seguinte forma:

$$Zhang(A \rightarrow B) = $$ $$\frac{Support(A \& B) - Support(A) Support(B)}{ max[Support(AB) (1-Support(A)), Support(A)(Support(B)-Support(AB))]}$$

Este exercício faz parte do curso

Análise de Cesta de Compras em Python

Ver curso

Instruções do exercício

  • Calcule o suporte de {Twilight} e o suporte de {Potter}.
  • Calcule o suporte de {Twilight, Potter}.
  • Complete a expressão do denominador.
  • Calcule a métrica de Zhang para {Twilight} \(\rightarrow\) {Potter}.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Compute the support of Twilight and Harry Potter
supportT = books['Twilight'].____
supportP = books['Potter'].____

# Compute the support of both books
supportTP = ____.mean()

# Complete the expressions for the numerator and denominator
numerator = supportTP - supportT*supportP
denominator = ___(supportTP*(1-supportT), supportT*(supportP-supportTP))

# Compute and print Zhang's metric
zhang = ____ / ____
print(zhang)
Editar e executar o código