Test d’hypothèse : ralentissent-ils ?
Nous allons maintenant tester l’hypothèse nulle selon laquelle le temps de passage du nageur n’est pas du tout corrélé à la distance parcourue dans la course. Nous utiliserons le coefficient de corrélation de Pearson (calculé avec dcst.pearson_r()) comme statistique de test.
Cet exercice fait partie du cours
Études de cas en pensée statistique
Instructions
- Calculez la corrélation de Pearson observée et stockez-la dans
rho. - À l’aide de
np.empty(), initialisez le tableau de 10 000 réplicats par permutation de la corrélation de Pearson, nomméperm_reps_rho. - Écrivez une boucle
forpour :- Mélanger le tableau des numéros de fraction de course avec
np.random.permutation(), et nommez-lescrambled_split_number. - Calculer le coefficient de corrélation de Pearson entre ce tableau mélangé et les temps moyens par fraction, puis l’enregistrer dans
perm_reps_rho.
- Mélanger le tableau des numéros de fraction de course avec
- Calculez la valeur p et affichez-la à l’écran. Interprétez « au moins aussi extrême que » comme une corrélation de Pearson au moins aussi grande que celle observée.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Observed correlation
rho = ____
# Initialize permutation reps
perm_reps_rho = ____
# Make permutation reps
for i in range(10000):
# Scramble the split number array
scrambled_split_number = ____
# Compute the Pearson correlation coefficient
____[i] = ____
# Compute and print p-value
p_val = ____(____ >= ____) / ____
print('p =', p_val)