Échantillonner des tirages a posteriori
Las de travailler pour l’administration centrale puis pour l’entreprise de marketing, vous prenez un nouveau poste d’analyste de données pour les autorités locales de votre ville. La ville exploite un système de vélos en libre-service et vous demande de prédire le nombre de vélos loués par jour afin de planifier les effectifs et les réparations.
On vous a fourni des données sur le nombre de véhicules loués par jour, la température, l’humidité, la vitesse du vent et le fait que le jour soit ouvré ou non :
work_day temp humidity wind_speed num_bikes
0 0 0.344167 0.805833 0.160446 0.985
1 0 0.363478 0.696087 0.248539 0.801
.. ... ... ... ... ...
698 1 0.280870 0.555652 0.115522 5.323
699 1 0.298333 0.649583 0.058471 5.668
Essayez de construire un modèle de régression pour prédire num_bikes en utilisant le DataFrame bikes et pymc3 (importé sous l’alias pm).
REMARQUE : Le premier appel à pm.sample() dans une nouvelle session Python peut prendre du temps, car du code Python est compilé en C en arrière-plan. Pour vous faire gagner du temps, nous vous demandons uniquement d’écrire le code correct, sans l’exécuter.
Cet exercice fait partie du cours
Analyse de données bayésienne en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice