Posterior-Ziehungen sampeln
Genug vom Job bei der Zentralregierung und der Marketingfirma: Du nimmst eine neue Stelle als Data Analyst bei deiner Stadtverwaltung an. Die Stadt betreibt ein Bike-Sharing-System und bittet dich, die Anzahl der pro Tag ausgeliehenen Fahrräder vorherzusagen, um Personal und Reparaturen zu planen.
Du hast Daten zur Anzahl der ausgeliehenen Fahrzeuge pro Tag, Temperatur, Luftfeuchtigkeit, Windgeschwindigkeit und dazu, ob es ein Arbeitstag war:
work_day temp humidity wind_speed num_bikes
0 0 0.344167 0.805833 0.160446 0.985
1 0 0.363478 0.696087 0.248539 0.801
.. ... ... ... ... ...
698 1 0.280870 0.555652 0.115522 5.323
699 1 0.298333 0.649583 0.058471 5.668
Versuche, ein Regressionsmodell zu bauen, das num_bikes mit dem DataFrame bikes und pymc3 (als pm importiert) vorhersagt.
HINWEIS: Der erste Aufruf von pm.sample() in einer frischen Python-Session dauert etwas, da Python-Code im Hintergrund zu C kompiliert wird. Um dir Zeit zu sparen, sollst du hier nur den Code korrekt schreiben, nicht ausführen.
Diese Übung ist Teil des Kurses
Bayesianische Datenanalyse in Python
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten