CommencerCommencer gratuitement

Test d’hypothèse sur la corrélation de Pearson

La corrélation observée entre l’illettrisme féminin et la fécondité peut être due au hasard ; la fécondité d’un pays donné peut en réalité être totalement indépendante de son illettrisme. Vous allez tester cette hypothèse. Pour ce faire, permutez les valeurs d’illettrisme tout en laissant fixes les valeurs de fécondité. Cela simule l’hypothèse selon laquelle elles sont totalement indépendantes l’une de l’autre. Pour chaque permutation, calculez le coefficient de corrélation de Pearson et évaluez combien de vos répliques par permutation ont un coefficient de corrélation de Pearson supérieur à celui observé.

La fonction pearson_r() que vous avez écrite dans la première partie de ce cours pour calculer le coefficient de corrélation de Pearson est déjà disponible.

Cet exercice fait partie du cours

Réflexion statistique en Python (Partie 2)

Afficher le cours

Instructions

  • Calculez la corrélation de Pearson observée entre illiteracy et fertility.
  • Initialisez un tableau pour stocker vos répliques par permutation.
  • Écrivez une boucle for pour générer 10 000 répliques :
    • Permutez les mesures d’illiteracy avec np.random.permutation().
    • Calculez la corrélation de Pearson entre le tableau d’illettrisme permuté, illiteracy_permuted, et fertility.
  • Calculez et affichez la p-valeur à partir des répliques.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute observed correlation: r_obs
r_obs = ____

# Initialize permutation replicates: perm_replicates
perm_replicates = np.empty(10000)

# Draw replicates
for ____ in ____:
    # Permute illiteracy measurments: illiteracy_permuted
    illiteracy_permuted = ____

    # Compute Pearson correlation
    perm_replicates[i] = ____

# Compute p-value: p
p = ____
print('p-val =', p)
Modifier et exécuter le code