Exécuter un bootstrap simple

Bienvenue dans le premier exercice de la section dédiée au bootstrapping. Nous allons travailler sur un exemple pour apprendre à exécuter un bootstrap simple. Comme vu dans la vidéo, l’idée principale du bootstrapping est l’échantillonnage avec remise.

Supposons que vous possédiez une usine qui fabrique des clés. Vous souhaitez caractériser la longueur moyenne des clés et vérifier qu’elles respectent certaines spécifications. Votre usine produit des milliers de clés chaque jour, mais il est irréaliste de mesurer la longueur de chacune. En revanche, vous disposez d’un échantillon représentatif de 100 clés. Utilisons le bootstrapping pour obtenir l’intervalle de confiance (IC) à 95 % des longueurs moyennes.

Examinez la liste wrench_lengths, qui contient 100 longueurs observées de clés, dans le terminal.

Cet exercice fait partie du cours

Simulation statistique en Python

Afficher le cours

Instructions

Tirez un échantillon aléatoire avec remise à partir de wrench_lengths et stockez-le dans temp_sample. Définissez size = len(wrench_lengths).
Calculez la longueur moyenne de chaque échantillon, affectez-la à sample_mean, puis ajoutez-la à mean_lengths.
Calculez la moyenne bootstrapée (boot_mean) et l’intervalle de confiance bootstrapé à 95 % (boot_95_ci) en utilisant np.percentile().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Draw some random sample with replacement and append mean to mean_lengths.
mean_lengths, sims = [], 1000
for i in range(sims):
    temp_sample = ____(____, replace=____, size=____)
    sample_mean = ____
    mean_lengths.append(sample_mean)
    
# Calculate bootstrapped mean and 95% confidence interval.
boot_mean = np.mean(____)
boot_95_ci = ____(mean_lengths, [2.5, 97.5])
print("Bootstrapped Mean Length = {}, 95% CI = {}".format(boot_mean, boot_95_ci))

Modifier et exécuter le code

Cet exercice fait partie du cours

Simulation statistique en Python

IntermédiaireNiveau de compétence

4.9+

Commencer le cours gratuitement

Ce chapitre vous donne les outils nécessaires pour exécuter une simulation. Nous commencerons par un rappel sur les variables aléatoires et les distributions de probabilité. Nous verrons ensuite comment lancer une simulation en examinant d’abord un flux de travail type, puis en le recréant dans le contexte d’un jeu de dés. Enfin, vous apprendrez à utiliser les simulations pour prendre des décisions.

Exercise 1: Introduction aux variables aléatoires Exercise 2: np.random.choice()Exercise 3: Variable aléatoire de Poisson Exercise 4: Mélanger un jeu de cartes Exercise 5: Notions de base sur la simulation Exercise 6: Lancer un dé équilibré Exercise 7: Lancer deux dés équilibrés Exercise 8: Simuler le jeu de dés Exercise 9: Utiliser la simulation pour la prise de décision Exercise 10: Simuler un tirage de loterie Exercise 11: Doit-on acheter ?Exercise 12: Calculer un prix de loterie d’équilibre

Ce chapitre propose une introduction aux concepts de probabilité et une compréhension pratique du processus de génération des données. Nous étudierons plusieurs exemples de modélisation de ce processus et terminerons par la modélisation d’une simulation publicitaire en e-commerce.

Exercise 1: Notions de probabilité Exercise 2: Dame et pique Exercise 3: Une paire Exercise 4: Jeu de treize Exercise 5: Concepts supplémentaires de probabilité Exercise 6: L’urne conditionnelle Exercise 7: Le paradoxe des anniversaires Exercise 8: Full house Exercise 9: Processus de génération des données Exercise 10: Permis de conduire Exercise 11: Élections nationales Exercise 12: Objectifs forme physique Exercise 13: Simulation de publicité e-commerce Exercise 14: Parcours d’inscription Exercise 15: Parcours d'achat Exercise 16: Probabilité de perdre de l’argent

Dans ce chapitre, vous découvrirez brièvement les méthodes de rééchantillonnage et leurs applications. Vous aurez un aperçu du bootstrap, du jackknife et des tests par permutation. À l’issue de ce chapitre, vous serez en mesure de commencer à appliquer des méthodes simples de rééchantillonnage pour l’analyse de données.

Exercise 1: Introduction aux méthodes de rééchantillonnage Exercise 2: Échantillonnage avec remise Exercise 3: Exemple de probabilité Exercise 4: Bootstrap Exercise 5: Exécuter un bootstrap simple

Exercice en cours

Exercise 6: Estimateurs non standards Exercise 7: Bootstrap en régression Exercise 8: Rééchantillonnage jackknife Exercise 9: Estimation jackknife de base - moyenne Exercise 10: Intervalle de confiance jackknife pour la médiane Exercise 11: Test par permutation Exercise 12: Générer une permutation unique Exercise 13: Test d’hypothèse - Différence de moyennes Exercise 14: Tests d’hypothèses - Statistiques non standard

Dans ce chapitre, vous serez initié à des applications basiques et avancées de la simulation pour résoudre des problèmes concrets. Nous traiterons un cas de planification d’entreprise, verrons l’intégration de Monte Carlo, l’analyse de puissance par simulation et conclurons par une simulation de portefeuille financier. Après ce chapitre, vous serez prêt à utiliser la simulation pour résoudre des problèmes du quotidien.

Exercise 1: Simulation pour la planification d’entreprise Exercise 2: Modéliser la production de maïs Exercise 3: Modéliser les bénéfices Exercise 4: Optimiser les coûts Exercise 5: Intégration de Monte Carlo Exercise 6: Intégrer une fonction simple Exercise 7: Calculer la valeur de pi Exercise 8: Simulation pour l’analyse de puissance Exercise 9: Facteurs influençant la puissance statistique Exercise 10: Analyse de puissance - Partie I Exercise 11: Analyse de puissance - Partie II Exercise 12: Applications en finance Exercise 13: Simulation de portefeuille - Partie I Exercise 14: Simulation de portefeuille - Partie II Exercise 15: Simulation de portefeuille - Partie III Exercise 16: Conclusion