Test d’hypothèse sur la corrélation de Pearson
La corrélation observée entre l’illettrisme féminin et la fécondité peut être due au hasard ; la fécondité d’un pays donné peut en réalité être totalement indépendante de son illettrisme. Vous allez tester cette hypothèse. Pour ce faire, permutez les valeurs d’illettrisme tout en laissant fixes les valeurs de fécondité. Cela simule l’hypothèse selon laquelle elles sont totalement indépendantes l’une de l’autre. Pour chaque permutation, calculez le coefficient de corrélation de Pearson et évaluez combien de vos répliques par permutation ont un coefficient de corrélation de Pearson supérieur à celui observé.
La fonction pearson_r() que vous avez écrite dans la première partie de ce cours pour calculer le coefficient de corrélation de Pearson est déjà disponible.
Cet exercice fait partie du cours
Réflexion statistique en Python (Partie 2)
Instructions
- Calculez la corrélation de Pearson observée entre
illiteracyetfertility. - Initialisez un tableau pour stocker vos répliques par permutation.
- Écrivez une boucle
forpour générer 10 000 répliques :- Permutez les mesures d’
illiteracyavecnp.random.permutation(). - Calculez la corrélation de Pearson entre le tableau d’illettrisme permuté,
illiteracy_permuted, etfertility.
- Permutez les mesures d’
- Calculez et affichez la p-valeur à partir des répliques.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute observed correlation: r_obs
r_obs = ____
# Initialize permutation replicates: perm_replicates
perm_replicates = np.empty(10000)
# Draw replicates
for ____ in ____:
# Permute illiteracy measurments: illiteracy_permuted
illiteracy_permuted = ____
# Compute Pearson correlation
perm_replicates[i] = ____
# Compute p-value: p
p = ____
print('p-val =', p)