CommencerCommencer gratuitement

Test d’hypothèse bootstrap à deux échantillons pour une différence de moyennes

Nous voulons maintenant tester l’hypothèse selon laquelle la Grenouille A et la Grenouille B ont la même force d’impact moyenne, sans supposer qu’elles suivent la même distribution, ce qui est également impossible avec un test de permutation.

Pour effectuer le test bootstrap à deux échantillons, nous décalons les deux tableaux afin qu’ils aient la même moyenne, puisque nous simulons l’hypothèse que leurs moyennes sont égales. Nous tirons ensuite des échantillons bootstrap à partir des tableaux décalés et calculons la différence de moyennes. Cela constitue un réplicat bootstrap, et nous en générons un grand nombre. La p-valeur est la fraction de réplicats dont la différence de moyennes est supérieure ou égale à celle observée.

Les objets forces_concat et empirical_diff_means sont déjà dans votre espace de noms.

Cet exercice fait partie du cours

Réflexion statistique en Python (Partie 2)

Afficher le cours

Instructions

  • Calculez la moyenne de toutes les forces (issues de forces_concat) avec np.mean().
  • Générez des jeux de données décalés pour forcea et pour forceb de sorte que la moyenne de chacun soit la moyenne du tableau concaténé des forces d’impact.
  • Générez 10 000 réplicats bootstrap de la moyenne pour chacun des deux tableaux décalés.
  • Calculez les réplicats bootstrap de la différence des moyennes en soustrayant les réplicats de la force d’impact décalée de la Grenouille B de ceux de la Grenouille A.
  • Calculez et affichez la p-valeur à partir de vos réplicats bootstrap.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute mean of all forces: mean_force
mean_force = ____

# Generate shifted arrays
force_a_shifted = force_a - np.mean(force_a) + mean_force
force_b_shifted = ____ 

# Compute 10,000 bootstrap replicates from shifted arrays
bs_replicates_a = draw_bs_reps(____, ____, ____)
bs_replicates_b = draw_bs_reps(____, ____, ____)

# Get replicates of difference of means: bs_replicates
bs_replicates = ____

# Compute and print p-value: p
p = ____ / ____
print('p-value =', p)
Modifier et exécuter le code