Test d’hypothèse : est-ce dû au hasard ?
L’EDA et la régression linéaire sont assez concluantes. Néanmoins, vous allez compléter l’analyse de l’effet zigzag en testant, via un test de permutation, l’hypothèse selon laquelle l’attribution des lignes n’a aucun lien avec la différence fractionnaire moyenne entre les lignes paires et impaires. Vous utiliserez le coefficient de corrélation de Pearson, que vous pouvez calculer avec dcst.pearson_r() comme statistique de test. Les variables lanes et f_13 sont déjà disponibles dans votre espace de travail.
Cet exercice fait partie du cours
Études de cas en pensée statistique
Instructions
- Calculez le coefficient de corrélation de Pearson observé et stockez-le dans
rho. - Initialisez un tableau pour stocker 10 000 réplicats par permutation de
rhoà l’aide denp.empty(). Nommez ce tableauperm_reps_rho. - Écrivez une boucle
forpour générer les réplicats par permutation.- Mélangez le tableau
lanesavecnp.random.permutation(). - Calculez le coefficient de corrélation de Pearson entre le tableau
lanesmélangé etf_13. Stockez le résultat dansperm_reps_rho.
- Mélangez le tableau
- Calculez et affichez la p-value. Considérez « au moins aussi extrême que » comme un coefficient de corrélation de Pearson supérieur ou égal à la valeur observée.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute observed correlation: rho
rho = ____
# Initialize permutation reps: perm_reps_rho
perm_reps_rho = ____
# Make permutation reps
for i in range(10000):
# Scramble the lanes array: scrambled_lanes
scrambled_lanes = ____
# Compute the Pearson correlation coefficient
____[i] = ____
# Compute and print p-value
p_val = ____(____ >= ____) / 10000
print('p =', p_val)