Générer une permutation unique
Dans les prochains exercices, nous allons réaliser un test de significativité par permutation. Comme expliqué dans la vidéo, nous voulons voir s’il existe une différence entre les dons générés par les deux designs – A et B. Supposons que vous ayez exécuté les deux versions pendant quelques jours et obtenu 500 dons pour A et 700 pour B, stockés dans les variables donations_A et donations_B.
Nous devons d’abord générer une distribution nulle pour la différence de moyennes. Pour cela, nous allons produire plusieurs permutations du jeu de données et calculer la différence de moyennes pour chaque cas.
Commençons par générer une permutation et calculer la différence de moyennes pour le jeu de données permuté.
Cet exercice fait partie du cours
Simulation statistique en Python
Instructions
- Concaténez les deux tableaux
donations_Aetdonations_Bavecnp.concatenate()et affectez le résultat àdata. - Obtenez une permutation unique avec
np.random.permutation()et affectez-la àperm. - Calculez la différence des valeurs moyennes de
permuted_Aetpermuted_Bet stockez-la dansdiff_in_means.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Concatenate the two arrays donations_A and donations_B into data
len_A, len_B = len(donations_A), len(donations_B)
data = ____([donations_A, donations_B])
# Get a single permutation of the concatenated length
perm = ____(len(donations_A) + len(donations_B))
# Calculate the permutated datasets and difference in means
permuted_A = data[perm[:len(donations_A)]]
permuted_B = data[perm[len(donations_A):]]
diff_in_means = ____
print("Difference in the permuted mean values = {}.".format(diff_in_means))