Échantillonner des tirages a posteriori

Las de travailler pour l’administration centrale puis pour l’entreprise de marketing, vous prenez un nouveau poste d’analyste de données pour les autorités locales de votre ville. La ville exploite un système de vélos en libre-service et vous demande de prédire le nombre de vélos loués par jour afin de planifier les effectifs et les réparations.

On vous a fourni des données sur le nombre de véhicules loués par jour, la température, l’humidité, la vitesse du vent et le fait que le jour soit ouvré ou non :

     work_day      temp  humidity  wind_speed  num_bikes
0           0  0.344167  0.805833    0.160446      0.985
1           0  0.363478  0.696087    0.248539      0.801
..        ...       ...       ...         ...        ...
698         1  0.280870  0.555652    0.115522      5.323
699         1  0.298333  0.649583    0.058471      5.668

Essayez de construire un modèle de régression pour prédire num_bikes en utilisant le DataFrame bikes et pymc3 (importé sous l’alias pm).

REMARQUE : Le premier appel à pm.sample() dans une nouvelle session Python peut prendre du temps, car du code Python est compilé en C en arrière-plan. Pour vous faire gagner du temps, nous vous demandons uniquement d’écrire le code correct, sans l’exécuter.

Cet exercice fait partie du cours

Analyse de données bayésienne en Python

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice

Cet exercice fait partie du cours

Analyse de données bayésienne en Python

IntermédiaireNiveau de compétence

4.8+

Commencer le cours gratuitement

Faites vos premiers pas dans l’univers bayésien. Dans ce chapitre, vous découvrirez les notions essentielles de probabilité et de distributions statistiques, ainsi que le célèbre théorème de Bayes, pierre angulaire des méthodes bayésiennes. Pour finir, vous construirez votre premier modèle bayésien afin de tirer des conclusions à partir de lancers de pièce aléatoires.

Exercise 1: Qui est Bayes ? Qu’est-ce que Bayes ?Exercise 2: Bayésiens vs. Fréquentistes Exercise 3: Lois de probabilité Exercise 4: Probabilités et théorème de Bayes Exercise 5: Jouons aux cartes Exercise 6: Filtre antispam bayésien Exercise 7: Que dit le test ?Exercise 8: Goûter au Bayes Exercise 9: Lancer une pièce Exercise 10: Plus vous lancez, plus vous apprenez Exercise 11: Alors, cette pièce est-elle équilibrée ?

Il est temps de soulever le capot bayésien. Vous apprendrez à appliquer le théorème de Bayes à des données d’efficacité d’un médicament pour estimer les paramètres de distributions de probabilité à l’aide de la technique d’approximation par grille, puis à mettre à jour ces estimations à mesure que de nouvelles données arrivent. Ensuite, vous verrez comment intégrer des connaissances a priori dans le modèle, avant de vous exercer à l’indispensable compétence de restitution des résultats à un public non technique.

Exercise 1: Sous le capot bayésien Exercise 2: Vers l’approximation par grille Exercise 3: Approximation par grille sans connaissance a priori Exercise 4: Mise à jour de la croyance a posteriori Exercise 5: Croyance a priori Exercise 6: La vérité sur l’a priori Exercise 7: Choisir la bonne loi a priori Exercise 8: Simuler des tirages a posteriori Exercise 9: Présenter des résultats bayésiens Exercise 10: Estimations ponctuelles Exercise 11: Intervalles de crédibilité de densité a posteriori maximale Exercise 12: Le sens de la crédibilité

Mettez en pratique vos nouvelles compétences en analyse bayésienne pour résoudre des problématiques métiers réelles. Vous travaillerez sur des données de marketing de ventes en ligne pour mener des tests A/B, de l’analyse de décision et de la prévision avec des modèles de régression linéaire.

Exercise 1: Test A/B Exercise 2: Simuler une postérieure bêta Exercise 3: Taux de clics a posteriori Exercise 4: A ou B, et avec quel degré de certitude ?Exercise 5: Quel est le pire scénario ?Exercise 6: Analyse de décision Exercise 7: Analyse de décision : coût Exercise 8: Analyse de décision : profit Exercise 9: Régression et prévision Exercise 10: Définir un modèle de régression bayésienne Exercise 11: Analyzing regression parameters Exercise 12: Distribution prédictive

Dans ce dernier chapitre, vous exploiterez la puissance du package PyMC3 pour ajuster facilement des modèles de régression bayésiens, vérifier la convergence d’un modèle, choisir entre des modèles concurrents et générer des prédictions pour de nouvelles données. Pour conclure, vous appliquerez ce que vous avez appris afin de déterminer le prix optimal des avocats dans une étude de cas d’analyse bayésienne. Bonne chance !

Exercise 1: Chaînes de Markov Monte Carlo et ajustement de modèle Exercise 2: Chaîne de Markov Monte Carlo Exercise 3: Échantillonner des tirages a posteriori

Exercice en cours

Exercise 4: Interpréter les résultats et comparer les modèles Exercise 5: Examiner les tirages a posteriori Exercise 6: Comparer des modèles avec la WAIC Exercise 7: Faire des prédictions Exercise 8: Échantillonner depuis la densité prédictive Exercise 9: Estimer l’erreur de test Exercise 10: Combien coûte un avocat ?Exercise 11: Ajuster le modèle Exercise 12: Inspection du modèle Exercise 13: Optimiser le prix Exercise 14: Remarques finales