CommencerCommencer gratuitement

Échantillonner des tirages a posteriori

Las de travailler pour l’administration centrale puis pour l’entreprise de marketing, vous prenez un nouveau poste d’analyste de données pour les autorités locales de votre ville. La ville exploite un système de vélos en libre-service et vous demande de prédire le nombre de vélos loués par jour afin de planifier les effectifs et les réparations.

On vous a fourni des données sur le nombre de véhicules loués par jour, la température, l’humidité, la vitesse du vent et le fait que le jour soit ouvré ou non :

     work_day      temp  humidity  wind_speed  num_bikes
0           0  0.344167  0.805833    0.160446      0.985
1           0  0.363478  0.696087    0.248539      0.801
..        ...       ...       ...         ...        ...
698         1  0.280870  0.555652    0.115522      5.323
699         1  0.298333  0.649583    0.058471      5.668

Essayez de construire un modèle de régression pour prédire num_bikes en utilisant le DataFrame bikes et pymc3 (importé sous l’alias pm).

REMARQUE : Le premier appel à pm.sample() dans une nouvelle session Python peut prendre du temps, car du code Python est compilé en C en arrière-plan. Pour vous faire gagner du temps, nous vous demandons uniquement d’écrire le code correct, sans l’exécuter.

Cet exercice fait partie du cours

Analyse de données bayésienne en Python

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice