Test d’hypothèse - Différence de moyennes

Nous voulons tester l’hypothèse selon laquelle la moyenne des dons reçus par A et B est différente. Vous avez appris précédemment à générer une permutation des données. Nous allons maintenant générer une distribution nulle de la différence de moyennes, puis calculer la valeur p.

Pour la distribution nulle, nous générons d’abord plusieurs jeux de données permutés et stockons la différence de moyennes pour chaque cas. Nous calculons ensuite la statistique de test comme la différence de moyennes avec le jeu de données original. Enfin, nous approchons la valeur p en calculant deux fois la fraction de cas où la différence est supérieure ou égale à la valeur absolue de la statistique de test (hypothèse bilatérale). Une valeur p inférieure, disons, à 0,05 peut alors indiquer une significativité statistique.

Cet exercice fait partie du cours

Simulation statistique en Python

Afficher le cours

Instructions

Générez plusieurs permutations de donations_A et donations_B et affectez-les à perm.
Définissez samples comme la différence des moyennes de permuted_A_datasets et permuted_B_datasets. Nous définissons axis=1 pour obtenir une moyenne par jeu de données plutôt qu’une moyenne globale.
Définissez test_stat comme la différence des moyennes de donations_A et donations_B.
Calculez la valeur p p_val comme deux fois la fraction des éléments de samples supérieurs ou égaux à la valeur absolue de test_stat.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Generate permutations equal to the number of repetitions
perm = np.array([np.random.____(len(____) + len(____)) for i in range(reps)])
permuted_A_datasets = data[perm[:, :len(donations_A)]]
permuted_B_datasets = data[perm[:, len(donations_A):]]

# Calculate the difference in means for each of the datasets
samples = np.mean(____, axis=1) - np.mean(____, axis=1)

# Calculate the test statistic and p-value
test_stat = ____
p_val = 2*np.sum(____ >= np.abs(____))/reps
print("p-value = {}".format(p_val))

Modifier et exécuter le code

Cet exercice fait partie du cours

Simulation statistique en Python

IntermédiaireNiveau de compétence

4.9+

Commencer le cours gratuitement

Ce chapitre vous donne les outils nécessaires pour exécuter une simulation. Nous commencerons par un rappel sur les variables aléatoires et les distributions de probabilité. Nous verrons ensuite comment lancer une simulation en examinant d’abord un flux de travail type, puis en le recréant dans le contexte d’un jeu de dés. Enfin, vous apprendrez à utiliser les simulations pour prendre des décisions.

Exercise 1: Introduction aux variables aléatoires Exercise 2: np.random.choice()Exercise 3: Variable aléatoire de Poisson Exercise 4: Mélanger un jeu de cartes Exercise 5: Notions de base sur la simulation Exercise 6: Lancer un dé équilibré Exercise 7: Lancer deux dés équilibrés Exercise 8: Simuler le jeu de dés Exercise 9: Utiliser la simulation pour la prise de décision Exercise 10: Simuler un tirage de loterie Exercise 11: Doit-on acheter ?Exercise 12: Calculer un prix de loterie d’équilibre

Ce chapitre propose une introduction aux concepts de probabilité et une compréhension pratique du processus de génération des données. Nous étudierons plusieurs exemples de modélisation de ce processus et terminerons par la modélisation d’une simulation publicitaire en e-commerce.

Exercise 1: Notions de probabilité Exercise 2: Dame et pique Exercise 3: Une paire Exercise 4: Jeu de treize Exercise 5: Concepts supplémentaires de probabilité Exercise 6: L’urne conditionnelle Exercise 7: Le paradoxe des anniversaires Exercise 8: Full house Exercise 9: Processus de génération des données Exercise 10: Permis de conduire Exercise 11: Élections nationales Exercise 12: Objectifs forme physique Exercise 13: Simulation de publicité e-commerce Exercise 14: Parcours d’inscription Exercise 15: Parcours d'achat Exercise 16: Probabilité de perdre de l’argent

Dans ce chapitre, vous découvrirez brièvement les méthodes de rééchantillonnage et leurs applications. Vous aurez un aperçu du bootstrap, du jackknife et des tests par permutation. À l’issue de ce chapitre, vous serez en mesure de commencer à appliquer des méthodes simples de rééchantillonnage pour l’analyse de données.

Exercise 1: Introduction aux méthodes de rééchantillonnage Exercise 2: Échantillonnage avec remise Exercise 3: Exemple de probabilité Exercise 4: Bootstrap Exercise 5: Exécuter un bootstrap simple Exercise 6: Estimateurs non standards Exercise 7: Bootstrap en régression Exercise 8: Rééchantillonnage jackknife Exercise 9: Estimation jackknife de base - moyenne Exercise 10: Intervalle de confiance jackknife pour la médiane Exercise 11: Test par permutation Exercise 12: Générer une permutation unique Exercise 13: Test d’hypothèse - Différence de moyennes

Exercice en cours

Exercise 14: Tests d’hypothèses - Statistiques non standard

Dans ce chapitre, vous serez initié à des applications basiques et avancées de la simulation pour résoudre des problèmes concrets. Nous traiterons un cas de planification d’entreprise, verrons l’intégration de Monte Carlo, l’analyse de puissance par simulation et conclurons par une simulation de portefeuille financier. Après ce chapitre, vous serez prêt à utiliser la simulation pour résoudre des problèmes du quotidien.

Exercise 1: Simulation pour la planification d’entreprise Exercise 2: Modéliser la production de maïs Exercise 3: Modéliser les bénéfices Exercise 4: Optimiser les coûts Exercise 5: Intégration de Monte Carlo Exercise 6: Intégrer une fonction simple Exercise 7: Calculer la valeur de pi Exercise 8: Simulation pour l’analyse de puissance Exercise 9: Facteurs influençant la puissance statistique Exercise 10: Analyse de puissance - Partie I Exercise 11: Analyse de puissance - Partie II Exercise 12: Applications en finance Exercise 13: Simulation de portefeuille - Partie I Exercise 14: Simulation de portefeuille - Partie II Exercise 15: Simulation de portefeuille - Partie III Exercise 16: Conclusion