Test par permutation : type sauvage vs hétérozygote
Testez, à l’aide d’un test par permutation, l’hypothèse selon laquelle les durées de séquence des hétérozygotes et du type sauvage suivent la même distribution.
Cet exercice fait partie du cours
<cours>Études de cas en pensée statistique</cours>Instructions de l’exercice
- Calculez la différence des moyennes (hétérozygote moins type sauvage) des jeux de données réels et stockez le résultat dans la variable
diff_means_exp. Les tableauxnumpybout_lengths_wtetbout_lengths_hetsont déjà disponibles dans votre espace de travail. - Générez 10 000 réplicats par permutation de la différence des moyennes en utilisant
dcst.draw_perm_reps(). Vous pouvez également utiliser la fonctiondcst.diff_of_means()et stocker le résultat dansperm_reps. - Calculez la p-value, en définissant « au moins aussi extrême que » comme le fait que la différence des moyennes sous l’hypothèse nulle soit supérieure ou égale à celle observée expérimentalement.
- Affichez la p-value à l’écran.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Compute the difference of means: diff_means_exp
diff_means_exp = ____ - ____
# Draw permutation replicates: perm_reps
perm_reps = ____(____, ____,
____, size=____)
# Compute the p-value: p-val
p_val = ____(____ >= ____) / len(____)
# Print the result
print('p =', p_val)