Test d’hypothèse bootstrap à deux échantillons pour une différence de moyennes
Nous voulons maintenant tester l’hypothèse selon laquelle la Grenouille A et la Grenouille B ont la même force d’impact moyenne, sans supposer qu’elles suivent la même distribution, ce qui est également impossible avec un test de permutation.
Pour effectuer le test bootstrap à deux échantillons, nous décalons les deux tableaux afin qu’ils aient la même moyenne, puisque nous simulons l’hypothèse que leurs moyennes sont égales. Nous tirons ensuite des échantillons bootstrap à partir des tableaux décalés et calculons la différence de moyennes. Cela constitue un réplicat bootstrap, et nous en générons un grand nombre. La p-valeur est la fraction de réplicats dont la différence de moyennes est supérieure ou égale à celle observée.
Les objets forces_concat et empirical_diff_means sont déjà dans votre espace de noms.
Cet exercice fait partie du cours
Réflexion statistique en Python (Partie 2)
Instructions
- Calculez la moyenne de toutes les forces (issues de
forces_concat) avecnp.mean(). - Générez des jeux de données décalés pour forcea et pour forceb de sorte que la moyenne de chacun soit la moyenne du tableau concaténé des forces d’impact.
- Générez 10 000 réplicats bootstrap de la moyenne pour chacun des deux tableaux décalés.
- Calculez les réplicats bootstrap de la différence des moyennes en soustrayant les réplicats de la force d’impact décalée de la Grenouille B de ceux de la Grenouille A.
- Calculez et affichez la p-valeur à partir de vos réplicats bootstrap.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute mean of all forces: mean_force
mean_force = ____
# Generate shifted arrays
force_a_shifted = force_a - np.mean(force_a) + mean_force
force_b_shifted = ____
# Compute 10,000 bootstrap replicates from shifted arrays
bs_replicates_a = draw_bs_reps(____, ____, ____)
bs_replicates_b = draw_bs_reps(____, ____, ____)
# Get replicates of difference of means: bs_replicates
bs_replicates = ____
# Compute and print p-value: p
p = ____ / ____
print('p-value =', p)