CommencerCommencer gratuitement

Un analogue au temps passé sur un site web

Vous avez déjà réalisé un test d’hypothèse analogue à un test A/B où l’on s’intéresse au temps passé sur un site web avant et après une campagne publicitaire. La force de la langue de grenouille (une quantité continue comme le temps passé sur le site) en est un analogue. « Avant » = Grenouille A et « après » = Grenouille B. Reprenons l’exercice avec un véritable scénario avant/après.

Revenons à l’ensemble de données sur les no-hitters. En 1920, la Major League Baseball a mis en place des changements de règles importants mettant fin à l’ère dite de la « dead ball ». Point crucial : le lanceur n’était plus autorisé à cracher sur la balle ni à l’érafler, des pratiques qui favorisaient grandement les lanceurs. Dans cet exercice, vous allez effectuer un test A/B pour déterminer si ces changements de règles ont entraîné un rythme plus lent de no-hitters (c’est-à-dire un temps moyen plus long entre deux no-hitters) en utilisant la différence des temps inter-no-hitter moyens comme statistique de test. Les temps inter-no-hitter pour les deux périodes sont stockés dans les tableaux nht_dead et nht_live, où « nht » signifie « no-hitter time ».

Comme vous utiliserez votre fonction draw_perm_reps() dans cet exercice, il peut être utile de vous rappeler sa signature d’appel : draw_perm_reps(d1, d2, func, size=1) ou même de revenir à l’exercice du chapitre 3 dans lequel vous l’avez définie.

Cet exercice fait partie du cours

Réflexion statistique en Python (Partie 2)

Afficher le cours

Instructions

  • Calculez la différence observée des temps inter-no-hitter moyens avec diff_of_means().
  • Générez 10 000 répliques par permutation de la différence des moyennes avec draw_perm_reps().
  • Calculez et affichez la p-value.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute the observed difference in mean inter-no-hitter times: nht_diff_obs
nht_diff_obs = ____

# Acquire 10,000 permutation replicates of difference in mean no-hitter time: perm_replicates
perm_replicates = ____


# Compute and print the p-value: p
p = ____
print('p-val =', p)
Modifier et exécuter le code