CommencerCommencer gratuitement

Test d’hypothèse : est-ce dû au hasard ?

L’EDA et la régression linéaire sont assez concluantes. Néanmoins, vous allez compléter l’analyse de l’effet zigzag en testant, via un test de permutation, l’hypothèse selon laquelle l’attribution des lignes n’a aucun lien avec la différence fractionnaire moyenne entre les lignes paires et impaires. Vous utiliserez le coefficient de corrélation de Pearson, que vous pouvez calculer avec dcst.pearson_r() comme statistique de test. Les variables lanes et f_13 sont déjà disponibles dans votre espace de travail.

Cet exercice fait partie du cours

Études de cas en pensée statistique

Afficher le cours

Instructions

  • Calculez le coefficient de corrélation de Pearson observé et stockez-le dans rho.
  • Initialisez un tableau pour stocker 10 000 réplicats par permutation de rho à l’aide de np.empty(). Nommez ce tableau perm_reps_rho.
  • Écrivez une boucle for pour générer les réplicats par permutation.
    • Mélangez le tableau lanes avec np.random.permutation().
    • Calculez le coefficient de corrélation de Pearson entre le tableau lanes mélangé et f_13. Stockez le résultat dans perm_reps_rho.
  • Calculez et affichez la p-value. Considérez « au moins aussi extrême que » comme un coefficient de corrélation de Pearson supérieur ou égal à la valeur observée.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute observed correlation: rho
rho = ____

# Initialize permutation reps: perm_reps_rho
perm_reps_rho = ____

# Make permutation reps
for i in range(10000):
    # Scramble the lanes array: scrambled_lanes
    scrambled_lanes = ____
    
    # Compute the Pearson correlation coefficient
    ____[i] = ____
    
# Compute and print p-value
p_val = ____(____ >= ____) / 10000
print('p =', p_val)
Modifier et exécuter le code