CommencerCommencer gratuitement

Générer une permutation unique

Dans les prochains exercices, nous allons réaliser un test de significativité par permutation. Comme expliqué dans la vidéo, nous voulons voir s’il existe une différence entre les dons générés par les deux designs – A et B. Supposons que vous ayez exécuté les deux versions pendant quelques jours et obtenu 500 dons pour A et 700 pour B, stockés dans les variables donations_A et donations_B.

Nous devons d’abord générer une distribution nulle pour la différence de moyennes. Pour cela, nous allons produire plusieurs permutations du jeu de données et calculer la différence de moyennes pour chaque cas.

Commençons par générer une permutation et calculer la différence de moyennes pour le jeu de données permuté.

Cet exercice fait partie du cours

Simulation statistique en Python

Afficher le cours

Instructions

  • Concaténez les deux tableaux donations_A et donations_B avec np.concatenate() et affectez le résultat à data.
  • Obtenez une permutation unique avec np.random.permutation() et affectez-la à perm.
  • Calculez la différence des valeurs moyennes de permuted_A et permuted_B et stockez-la dans diff_in_means.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Concatenate the two arrays donations_A and donations_B into data
len_A, len_B = len(donations_A), len(donations_B)
data = ____([donations_A, donations_B])

# Get a single permutation of the concatenated length
perm = ____(len(donations_A) + len(donations_B))

# Calculate the permutated datasets and difference in means
permuted_A = data[perm[:len(donations_A)]]
permuted_B = data[perm[len(donations_A):]]
diff_in_means = ____
print("Difference in the permuted mean values = {}.".format(diff_in_means))
Modifier et exécuter le code