Test par permutation : type sauvage vs hétérozygote
Testez, à l’aide d’un test par permutation, l’hypothèse selon laquelle les durées de séquence des hétérozygotes et du type sauvage suivent la même distribution.
Cet exercice fait partie du cours
Études de cas en pensée statistique
Instructions
- Calculez la différence des moyennes (hétérozygote moins type sauvage) des jeux de données réels et stockez le résultat dans la variable
diff_means_exp. Les tableauxnumpybout_lengths_wtetbout_lengths_hetsont déjà disponibles dans votre espace de travail. - Générez 10 000 réplicats par permutation de la différence des moyennes en utilisant
dcst.draw_perm_reps(). Vous pouvez également utiliser la fonctiondcst.diff_of_means()et stocker le résultat dansperm_reps. - Calculez la p-value, en définissant « au moins aussi extrême que » comme le fait que la différence des moyennes sous l’hypothèse nulle soit supérieure ou égale à celle observée expérimentalement.
- Affichez la p-value à l’écran.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute the difference of means: diff_means_exp
diff_means_exp = ____ - ____
# Draw permutation replicates: perm_reps
perm_reps = ____(____, ____,
____, size=____)
# Compute the p-value: p-val
p_val = ____(____ >= ____) / len(____)
# Print the result
print('p =', p_val)