Analyse de puissance - Partie I

Passons maintenant à l’analyse de puissance. En général, vous souhaitez vous assurer que toute expérience ou tout test A/B que vous lancez a au moins 80 % de puissance. Une façon d’y parvenir est de calculer la taille d’échantillon nécessaire pour atteindre 80 % de puissance.

Supposons que vous dirigiez un site d’actualités et que vous souhaitiez augmenter le temps passé par les utilisateurs sur votre site. Actuellement, le temps passé par les utilisateurs suit une loi normale avec une moyenne de 1 minute et un écart-type de 0,5 minute. Supposons que vous introduisiez une fonctionnalité qui accélère le chargement des pages et que vous vouliez connaître la taille d’échantillon nécessaire pour mesurer une augmentation de 5 % du temps passé sur le site.

Dans cet exercice, nous allons mettre en place le cadre pour exécuter une simulation, lancer un t-test, et calculer la p-value.

Cet exercice fait partie du cours

Simulation statistique en Python

Afficher le cours

Instructions

Initialisez effect_size à 5 %, control_mean à 1 et control_sd à 0,5.
À l’aide de np.random.normal(), simulez un tirage de control_time_spent et treatment_time_spent en utilisant les valeurs que vous avez initialisées.
Effectuez un t-test sur treatment_time_spent et control_time_spent avec st.ttest_ind() où st correspond à scipy.stats, déjà importé.
La significativité statistique stat_sig doit être True si p_value est inférieure à 0,05 ; sinon, elle doit être False.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Initialize effect_size, control_mean, control_sd
effect_size, sample_size, control_mean, control_sd = ____, 50, ____, ____

# Simulate control_time_spent and treatment_time_spent, assuming equal variance
control_time_spent = np.random.normal(loc=control_mean, scale=____, size=sample_size)
treatment_time_spent = np.random.normal(loc=____*(1+effect_size), scale=control_sd, size=____)

# Run the t-test and get the p_value
t_stat, p_value = st.ttest_ind(____, ____)
stat_sig = p_value < ____
print("P-value: {}, Statistically Significant? {}".format(p_value, stat_sig))

Modifier et exécuter le code

Cet exercice fait partie du cours

Simulation statistique en Python

IntermédiaireNiveau de compétence

4.9+

Commencer le cours gratuitement

Ce chapitre vous donne les outils nécessaires pour exécuter une simulation. Nous commencerons par un rappel sur les variables aléatoires et les distributions de probabilité. Nous verrons ensuite comment lancer une simulation en examinant d’abord un flux de travail type, puis en le recréant dans le contexte d’un jeu de dés. Enfin, vous apprendrez à utiliser les simulations pour prendre des décisions.

Exercise 1: Introduction aux variables aléatoires Exercise 2: np.random.choice()Exercise 3: Variable aléatoire de Poisson Exercise 4: Mélanger un jeu de cartes Exercise 5: Notions de base sur la simulation Exercise 6: Lancer un dé équilibré Exercise 7: Lancer deux dés équilibrés Exercise 8: Simuler le jeu de dés Exercise 9: Utiliser la simulation pour la prise de décision Exercise 10: Simuler un tirage de loterie Exercise 11: Doit-on acheter ?Exercise 12: Calculer un prix de loterie d’équilibre

Ce chapitre propose une introduction aux concepts de probabilité et une compréhension pratique du processus de génération des données. Nous étudierons plusieurs exemples de modélisation de ce processus et terminerons par la modélisation d’une simulation publicitaire en e-commerce.

Exercise 1: Notions de probabilité Exercise 2: Dame et pique Exercise 3: Une paire Exercise 4: Jeu de treize Exercise 5: Concepts supplémentaires de probabilité Exercise 6: L’urne conditionnelle Exercise 7: Le paradoxe des anniversaires Exercise 8: Full house Exercise 9: Processus de génération des données Exercise 10: Permis de conduire Exercise 11: Élections nationales Exercise 12: Objectifs forme physique Exercise 13: Simulation de publicité e-commerce Exercise 14: Parcours d’inscription Exercise 15: Parcours d'achat Exercise 16: Probabilité de perdre de l’argent

Dans ce chapitre, vous découvrirez brièvement les méthodes de rééchantillonnage et leurs applications. Vous aurez un aperçu du bootstrap, du jackknife et des tests par permutation. À l’issue de ce chapitre, vous serez en mesure de commencer à appliquer des méthodes simples de rééchantillonnage pour l’analyse de données.

Exercise 1: Introduction aux méthodes de rééchantillonnage Exercise 2: Échantillonnage avec remise Exercise 3: Exemple de probabilité Exercise 4: Bootstrap Exercise 5: Exécuter un bootstrap simple Exercise 6: Estimateurs non standards Exercise 7: Bootstrap en régression Exercise 8: Rééchantillonnage jackknife Exercise 9: Estimation jackknife de base - moyenne Exercise 10: Intervalle de confiance jackknife pour la médiane Exercise 11: Test par permutation Exercise 12: Générer une permutation unique Exercise 13: Test d’hypothèse - Différence de moyennes Exercise 14: Tests d’hypothèses - Statistiques non standard

Dans ce chapitre, vous serez initié à des applications basiques et avancées de la simulation pour résoudre des problèmes concrets. Nous traiterons un cas de planification d’entreprise, verrons l’intégration de Monte Carlo, l’analyse de puissance par simulation et conclurons par une simulation de portefeuille financier. Après ce chapitre, vous serez prêt à utiliser la simulation pour résoudre des problèmes du quotidien.

Exercise 1: Simulation pour la planification d’entreprise Exercise 2: Modéliser la production de maïs Exercise 3: Modéliser les bénéfices Exercise 4: Optimiser les coûts Exercise 5: Intégration de Monte Carlo Exercise 6: Intégrer une fonction simple Exercise 7: Calculer la valeur de pi Exercise 8: Simulation pour l’analyse de puissance Exercise 9: Facteurs influençant la puissance statistique Exercise 10: Analyse de puissance - Partie I

Exercice en cours

Exercise 11: Analyse de puissance - Partie II Exercise 12: Applications en finance Exercise 13: Simulation de portefeuille - Partie I Exercise 14: Simulation de portefeuille - Partie II Exercise 15: Simulation de portefeuille - Partie III Exercise 16: Conclusion