Testfout inschatten

Nu je posterior_predictive (beschikbaar in je workspace) klaarstaat, kun je de modelprestaties op nieuwe data evalueren. Hiervoor loop je over de testobservaties en bereken je voor elke observatie de voorspellingsfout als het verschil tussen de predictieve verdeling voor deze observatie en de daadwerkelijke, echte waarde. Dit levert de verdeling van de fout van je model op, die je daarna kunt visualiseren.

Je hebt pymc3 en numpy nodig, die al voor je zijn geïmporteerd als respectievelijk pm en np. De testdata, bikes_test, is ook beschikbaar in je workspace. Aan de slag!

Deze oefening maakt deel uit van de cursus

Bayesian Data Analysis in Python

Oefeninstructies

Initialiseer errors als een lege lijst.
Bereken voor elke rij in bikes_test de voorspellingsfout als de predictieve trekkingen voor deze rij uit posterior_predictive min de enkele echte waarde van num_bikes uit de rij.
Vorm errors om door ze naar een numpy-array te converteren en vervolgens de methode .reshape() toe te passen op het resultaat, en wijs de uiteindelijke uitkomst toe aan error_distribution.
Plot de testfoutverdeling met de functie plot_posterior() van pymc3.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Initialize errors
errors = ____

# Iterate over rows of bikes_test to compute error per row
for index, test_example in bikes_test.iterrows():
    error = ____[____][:, ____] - ____[____]
    errors.append(error)

# Reshape errors
error_distribution = ____(____).____()

# Plot the error distribution
____
plt.show()

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Bayesian Data Analysis in Python

SkillTag.level.intermediateSkillTag.label

4.8+

Begin gratis met de cursus

Zet je eerste stappen in de Bayesiaanse wereld. In dit hoofdstuk maak je kennis met de basisconcepten van kansen en statistische verdelingen, en met de beroemde stelling van Bayes, de hoeksteen van Bayesiaanse methoden. Tot slot bouw je je eerste Bayesiaanse model om conclusies te trekken uit willekeurige muntworpen.

Exercise 1: Wie is Bayes? Wat is Bayes?Exercise 2: Bayesianen vs. frequentisten Exercise 3: Kansverdelingen Exercise 4: Kansrekening en de stelling van Bayes Exercise 5: Laten we kaarten Exercise 6: Bayesiaans spamfilter Exercise 7: Wat zegt de test?Exercise 8: Proeven van Bayes Exercise 9: Een munt opgooien Exercise 10: Hoe meer je gooit, hoe meer je leert Exercise 11: Hé, is deze munt eerlijk?

Tijd om onder de Bayesiaanse motorkap te kijken. Je leert hoe je de stelling van Bayes toepast op gegevens over geneesmiddeleffectiviteit om de parameters van kansverdelingen te schatten met de rasterbenadering, en hoe je deze schattingen bijwerkt zodra er nieuwe data beschikbaar komen. Vervolgens leer je hoe je voorkennis in het model opneemt en oefen je tot slot de belangrijke vaardigheid om resultaten te rapporteren aan een niet-technisch publiek.

Exercise 1: Onder de Bayesiaanse motorkap Exercise 2: Op weg naar grid-approximatie Exercise 3: Rasterbenadering zonder voorkennis Exercise 4: Posterior bijwerken Exercise 5: A-prioriverwachting Exercise 6: De waarheid van de prior Exercise 7: De juiste prior kiezen Exercise 8: Posterior-trekkingen simuleren Exercise 9: Bayesiaanse resultaten rapporteren Exercise 10: Puntschattingen Exercise 11: Highest Posterior Density-credible intervals Exercise 12: De betekenis van geloofwaardigheid

Pas je nieuw verworven vaardigheden in Bayesiaanse data-analyse toe om echte zakelijke uitdagingen op te lossen. Je werkt met online marketing- en verkoopgegevens om A/B-testen, beslissingsanalyse en forecasting met lineaire regressiemodellen uit te voeren.

Exercise 1: A/B-testen Exercise 2: Simuleer beta-posterieur Exercise 3: Posterior klikpercentages Exercise 4: A of B, en hoe zeker zijn we?Exercise 5: Hoe erg kan het zijn?Exercise 6: Beslissingsanalyse Exercise 7: Beslissingsanalyse: kosten Exercise 8: Beslissingsanalyse: winst Exercise 9: Regressie en forecasting Exercise 10: Een Bayesiaans regressiemodel definiëren Exercise 11: Regressieparameters analyseren Exercise 12: Predictieve verdeling

In dit laatste hoofdstuk maak je gebruik van het krachtige PyMC3-pakket om eenvoudig Bayesiaanse regressiemodellen te fitten, sanity checks op de convergentie van een model uit te voeren, te kiezen tussen concurrerende modellen en voorspellingen voor nieuwe data te genereren. Ter afsluiting pas je wat je hebt geleerd toe om de optimale prijs voor avocado’s te vinden in een Bayesiaanse data-analysecasus. Succes!

Exercise 1: Markovketen-Monte Carlo en het fitten van modellen Exercise 2: Markov Chain Monte Carlo Exercise 3: Steekproeven trekken uit de posterior Exercise 4: Resultaten interpreteren en modellen vergelijken Exercise 5: Posterior-trekkingen inspecteren Exercise 6: Modellen vergelijken met WAIC Exercise 7: Voorspellingen maken Exercise 8: Steekproeven uit predictieve dichtheid Exercise 9: Testfout inschatten

Huidige oefening

Exercise 10: Wat kost een avocado?Exercise 11: Het model fitten Exercise 12: Het model inspecteren Exercise 13: De prijs optimaliseren Exercise 14: Tot slot