Quel est le pire scénario ?
Vous avez conclu qu’avec 98 % de probabilité, les publicités pour les vêtements ont un taux de clics supérieur à celles pour les baskets. Cela suggère de déployer la campagne « vêtements » auprès d’un public plus large. Cependant, il existe un risque de 2 % que ce soient en réalité les publicités pour les baskets qui soient meilleures. Dans ce cas, combien de clics perdrait-on si l’on déployait la campagne « vêtements » ?
La réponse correspond à la perte attendue : la différence moyenne a posteriori entre les deux taux de clics, conditionnellement au fait que les publicités pour les baskets performent mieux. Pour la calculer, il suffit de ne conserver que les valeurs de la différence a posteriori où le taux de clics des baskets est plus élevé, puis d’en calculer la moyenne.
La différence a posteriori entre les taux de clics, diff, est disponible dans votre environnement de travail. Voyons quel est le risque encouru !
Cet exercice fait partie du cours
Analyse de données bayésienne en Python
Instructions
- Découpez
diffpour ne garder que les cas où il est négatif (ce qui correspond à un taux de clics des baskets plus élevé) et affectez le résultat àloss. - Calculez la moyenne de
loss, affectez-la àexpected_losset affichez-la.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Slice diff to take only cases where it is negative
loss = ____
# Compute and print expected loss
expected_loss = ____
print(____)