Générer une permutation unique

Dans les prochains exercices, nous allons réaliser un test de significativité par permutation. Comme expliqué dans la vidéo, nous voulons voir s’il existe une différence entre les dons générés par les deux designs – A et B. Supposons que vous ayez exécuté les deux versions pendant quelques jours et obtenu 500 dons pour A et 700 pour B, stockés dans les variables donations_A et donations_B.

Nous devons d’abord générer une distribution nulle pour la différence de moyennes. Pour cela, nous allons produire plusieurs permutations du jeu de données et calculer la différence de moyennes pour chaque cas.

Commençons par générer une permutation et calculer la différence de moyennes pour le jeu de données permuté.

Cet exercice fait partie du cours

Simulation statistique en Python

Afficher le cours

Instructions

Concaténez les deux tableaux donations_A et donations_B avec np.concatenate() et affectez le résultat à data.
Obtenez une permutation unique avec np.random.permutation() et affectez-la à perm.
Calculez la différence des valeurs moyennes de permuted_A et permuted_B et stockez-la dans diff_in_means.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Concatenate the two arrays donations_A and donations_B into data
len_A, len_B = len(donations_A), len(donations_B)
data = ____([donations_A, donations_B])

# Get a single permutation of the concatenated length
perm = ____(len(donations_A) + len(donations_B))

# Calculate the permutated datasets and difference in means
permuted_A = data[perm[:len(donations_A)]]
permuted_B = data[perm[len(donations_A):]]
diff_in_means = ____
print("Difference in the permuted mean values = {}.".format(diff_in_means))

Modifier et exécuter le code

Cet exercice fait partie du cours

Simulation statistique en Python

IntermédiaireNiveau de compétence

4.9+

Commencer le cours gratuitement

Ce chapitre vous donne les outils nécessaires pour exécuter une simulation. Nous commencerons par un rappel sur les variables aléatoires et les distributions de probabilité. Nous verrons ensuite comment lancer une simulation en examinant d’abord un flux de travail type, puis en le recréant dans le contexte d’un jeu de dés. Enfin, vous apprendrez à utiliser les simulations pour prendre des décisions.

Exercise 1: Introduction aux variables aléatoires Exercise 2: np.random.choice()Exercise 3: Variable aléatoire de Poisson Exercise 4: Mélanger un jeu de cartes Exercise 5: Notions de base sur la simulation Exercise 6: Lancer un dé équilibré Exercise 7: Lancer deux dés équilibrés Exercise 8: Simuler le jeu de dés Exercise 9: Utiliser la simulation pour la prise de décision Exercise 10: Simuler un tirage de loterie Exercise 11: Doit-on acheter ?Exercise 12: Calculer un prix de loterie d’équilibre

Ce chapitre propose une introduction aux concepts de probabilité et une compréhension pratique du processus de génération des données. Nous étudierons plusieurs exemples de modélisation de ce processus et terminerons par la modélisation d’une simulation publicitaire en e-commerce.

Exercise 1: Notions de probabilité Exercise 2: Dame et pique Exercise 3: Une paire Exercise 4: Jeu de treize Exercise 5: Concepts supplémentaires de probabilité Exercise 6: L’urne conditionnelle Exercise 7: Le paradoxe des anniversaires Exercise 8: Full house Exercise 9: Processus de génération des données Exercise 10: Permis de conduire Exercise 11: Élections nationales Exercise 12: Objectifs forme physique Exercise 13: Simulation de publicité e-commerce Exercise 14: Parcours d’inscription Exercise 15: Parcours d'achat Exercise 16: Probabilité de perdre de l’argent

Dans ce chapitre, vous découvrirez brièvement les méthodes de rééchantillonnage et leurs applications. Vous aurez un aperçu du bootstrap, du jackknife et des tests par permutation. À l’issue de ce chapitre, vous serez en mesure de commencer à appliquer des méthodes simples de rééchantillonnage pour l’analyse de données.

Exercise 1: Introduction aux méthodes de rééchantillonnage Exercise 2: Échantillonnage avec remise Exercise 3: Exemple de probabilité Exercise 4: Bootstrap Exercise 5: Exécuter un bootstrap simple Exercise 6: Estimateurs non standards Exercise 7: Bootstrap en régression Exercise 8: Rééchantillonnage jackknife Exercise 9: Estimation jackknife de base - moyenne Exercise 10: Intervalle de confiance jackknife pour la médiane Exercise 11: Test par permutation Exercise 12: Générer une permutation unique

Exercice en cours

Exercise 13: Test d’hypothèse - Différence de moyennes Exercise 14: Tests d’hypothèses - Statistiques non standard

Dans ce chapitre, vous serez initié à des applications basiques et avancées de la simulation pour résoudre des problèmes concrets. Nous traiterons un cas de planification d’entreprise, verrons l’intégration de Monte Carlo, l’analyse de puissance par simulation et conclurons par une simulation de portefeuille financier. Après ce chapitre, vous serez prêt à utiliser la simulation pour résoudre des problèmes du quotidien.

Exercise 1: Simulation pour la planification d’entreprise Exercise 2: Modéliser la production de maïs Exercise 3: Modéliser les bénéfices Exercise 4: Optimiser les coûts Exercise 5: Intégration de Monte Carlo Exercise 6: Intégrer une fonction simple Exercise 7: Calculer la valeur de pi Exercise 8: Simulation pour l’analyse de puissance Exercise 9: Facteurs influençant la puissance statistique Exercise 10: Analyse de puissance - Partie I Exercise 11: Analyse de puissance - Partie II Exercise 12: Applications en finance Exercise 13: Simulation de portefeuille - Partie I Exercise 14: Simulation de portefeuille - Partie II Exercise 15: Simulation de portefeuille - Partie III Exercise 16: Conclusion