Analyse de puissance - Partie II

Précédemment, nous avons simulé une instance de l’expérience et généré une valeur p. Nous allons maintenant utiliser ce cadre pour calculer la puissance statistique. La puissance d’une expérience correspond à sa capacité à détecter une différence entre le groupe témoin et le groupe traité si cette différence existe réellement. Il est recommandé, par bonne pratique statistique, de viser une puissance de 80 %.

Pour notre site web, supposons que nous voulions savoir combien de personnes doivent visiter chaque variante pour détecter une augmentation de 10 % du temps passé avec une puissance de 80 %. Pour cela, nous commençons avec un petit échantillon (50), nous simulons plusieurs instances de cette expérience et nous évaluons la puissance. Si nous atteignons 80 % de puissance, nous nous arrêtons. Sinon, nous augmentons la taille de l’échantillon et réessayons.

Cet exercice fait partie du cours

Simulation statistique en Python

Afficher le cours

Instructions

Pour les variables aléatoires time_spent, définissez size comme des tuples de sorte que la forme soit sample_size \(\times\) sims.
Calculez power comme la fraction des valeurs p inférieures à 0,05 (statistiquement significatif).
Si power est supérieure ou égale à 80 %, utilisez break pour sortir de la boucle while. Sinon, continuez à incrémenter sample_size de 10.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

sample_size = 50

# Keep incrementing sample size by 10 till we reach required power
while 1:
    control_time_spent = np.random.normal(loc=control_mean, scale=control_sd, size=(____,____)))
    treatment_time_spent = np.random.normal(loc=control_mean*(1+effect_size), scale=control_sd, size=(____,____))
    t, p = st.ttest_ind(treatment_time_spent, control_time_spent)
    
    # Power is the fraction of times in the simulation when the p-value was less than 0.05
    power = (p < 0.05).sum()/____
    if ____: 
        ____
    else: 
        ____ += ____
print("For 80% power, sample size required = {}".format(sample_size))

Modifier et exécuter le code

Cet exercice fait partie du cours

Simulation statistique en Python

IntermédiaireNiveau de compétence

4.9+

Commencer le cours gratuitement

Ce chapitre vous donne les outils nécessaires pour exécuter une simulation. Nous commencerons par un rappel sur les variables aléatoires et les distributions de probabilité. Nous verrons ensuite comment lancer une simulation en examinant d’abord un flux de travail type, puis en le recréant dans le contexte d’un jeu de dés. Enfin, vous apprendrez à utiliser les simulations pour prendre des décisions.

Exercise 1: Introduction aux variables aléatoires Exercise 2: np.random.choice()Exercise 3: Variable aléatoire de Poisson Exercise 4: Mélanger un jeu de cartes Exercise 5: Notions de base sur la simulation Exercise 6: Lancer un dé équilibré Exercise 7: Lancer deux dés équilibrés Exercise 8: Simuler le jeu de dés Exercise 9: Utiliser la simulation pour la prise de décision Exercise 10: Simuler un tirage de loterie Exercise 11: Doit-on acheter ?Exercise 12: Calculer un prix de loterie d’équilibre

Ce chapitre propose une introduction aux concepts de probabilité et une compréhension pratique du processus de génération des données. Nous étudierons plusieurs exemples de modélisation de ce processus et terminerons par la modélisation d’une simulation publicitaire en e-commerce.

Exercise 1: Notions de probabilité Exercise 2: Dame et pique Exercise 3: Une paire Exercise 4: Jeu de treize Exercise 5: Concepts supplémentaires de probabilité Exercise 6: L’urne conditionnelle Exercise 7: Le paradoxe des anniversaires Exercise 8: Full house Exercise 9: Processus de génération des données Exercise 10: Permis de conduire Exercise 11: Élections nationales Exercise 12: Objectifs forme physique Exercise 13: Simulation de publicité e-commerce Exercise 14: Parcours d’inscription Exercise 15: Parcours d'achat Exercise 16: Probabilité de perdre de l’argent

Dans ce chapitre, vous découvrirez brièvement les méthodes de rééchantillonnage et leurs applications. Vous aurez un aperçu du bootstrap, du jackknife et des tests par permutation. À l’issue de ce chapitre, vous serez en mesure de commencer à appliquer des méthodes simples de rééchantillonnage pour l’analyse de données.

Exercise 1: Introduction aux méthodes de rééchantillonnage Exercise 2: Échantillonnage avec remise Exercise 3: Exemple de probabilité Exercise 4: Bootstrap Exercise 5: Exécuter un bootstrap simple Exercise 6: Estimateurs non standards Exercise 7: Bootstrap en régression Exercise 8: Rééchantillonnage jackknife Exercise 9: Estimation jackknife de base - moyenne Exercise 10: Intervalle de confiance jackknife pour la médiane Exercise 11: Test par permutation Exercise 12: Générer une permutation unique Exercise 13: Test d’hypothèse - Différence de moyennes Exercise 14: Tests d’hypothèses - Statistiques non standard

Dans ce chapitre, vous serez initié à des applications basiques et avancées de la simulation pour résoudre des problèmes concrets. Nous traiterons un cas de planification d’entreprise, verrons l’intégration de Monte Carlo, l’analyse de puissance par simulation et conclurons par une simulation de portefeuille financier. Après ce chapitre, vous serez prêt à utiliser la simulation pour résoudre des problèmes du quotidien.

Exercise 1: Simulation pour la planification d’entreprise Exercise 2: Modéliser la production de maïs Exercise 3: Modéliser les bénéfices Exercise 4: Optimiser les coûts Exercise 5: Intégration de Monte Carlo Exercise 6: Intégrer une fonction simple Exercise 7: Calculer la valeur de pi Exercise 8: Simulation pour l’analyse de puissance Exercise 9: Facteurs influençant la puissance statistique Exercise 10: Analyse de puissance - Partie I Exercise 11: Analyse de puissance - Partie II

Exercice en cours

Exercise 12: Applications en finance Exercise 13: Simulation de portefeuille - Partie I Exercise 14: Simulation de portefeuille - Partie II Exercise 15: Simulation de portefeuille - Partie III Exercise 16: Conclusion