Op weg naar grid-approximatie

Gefeliciteerd! Je bent zojuist aangenomen als data-analist bij het Ministerie van Volksgezondheid. Het kabinet overweegt de aanschaf van een gloednieuw medicijn tegen een dodelijk en besmettelijk virus. Er bestaan echter twijfels over hoe effectief het nieuwe medicijn is tegen het virus. Jij krijgt de taak om de werkzaamheid van het medicijn te schatten, oftewel het percentage patiënten dat door het medicijn geneest.

Er is snel een experiment opgezet waarbij 10 zieke patiënten met het medicijn zijn behandeld. Zodra je weet hoeveel van hen genezen zijn, kun je de binomiale verdeling gebruiken, waarbij een genezen patiënt een "succes" is en de werkzaamheid de "kans op succes". Terwijl je op de resultaten van het experiment wacht, besluit je het parameterrooster alvast voor te bereiden.

numpy en pandas zijn al voor je geïmporteerd als respectievelijk np en pd.

Deze oefening maakt deel uit van de cursus

Bayesian Data Analysis in Python

Oefeninstructies

Gebruik np.arange() om een array te maken met alle mogelijke aantallen genezen patiënten (van 0 tot en met 10) en wijs deze toe aan num_patients_cured.
Gebruik np.arange() om een array te maken met alle mogelijke waarden voor de werkzaamheid (van 0 tot 1, in stappen van 0,01) en wijs deze toe aan efficacy_rate.
Combineer num_patients_cured en efficacy_rate in een DataFrame genaamd df, met alle mogelijke combinaties van de twee.
Wijs ["num_patients_cured", "efficacy_rate"] toe aan de kolommen van df en print het.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create cured patients array from 1 to 10
num_patients_cured = ____

# Create efficacy rate array from 0 to 1 by 0.01
efficacy_rate = ____

# Combine the two arrays in one DataFrame
df = ____([(x, y) for x in ____ for y in ____])

# Name the columns
df.columns = ____

# Print df
print(df)

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Bayesian Data Analysis in Python

SkillTag.level.intermediateSkillTag.label

4.8+

Begin gratis met de cursus

Zet je eerste stappen in de Bayesiaanse wereld. In dit hoofdstuk maak je kennis met de basisconcepten van kansen en statistische verdelingen, en met de beroemde stelling van Bayes, de hoeksteen van Bayesiaanse methoden. Tot slot bouw je je eerste Bayesiaanse model om conclusies te trekken uit willekeurige muntworpen.

Exercise 1: Wie is Bayes? Wat is Bayes?Exercise 2: Bayesianen vs. frequentisten Exercise 3: Kansverdelingen Exercise 4: Kansrekening en de stelling van Bayes Exercise 5: Laten we kaarten Exercise 6: Bayesiaans spamfilter Exercise 7: Wat zegt de test?Exercise 8: Proeven van Bayes Exercise 9: Een munt opgooien Exercise 10: Hoe meer je gooit, hoe meer je leert Exercise 11: Hé, is deze munt eerlijk?

Tijd om onder de Bayesiaanse motorkap te kijken. Je leert hoe je de stelling van Bayes toepast op gegevens over geneesmiddeleffectiviteit om de parameters van kansverdelingen te schatten met de rasterbenadering, en hoe je deze schattingen bijwerkt zodra er nieuwe data beschikbaar komen. Vervolgens leer je hoe je voorkennis in het model opneemt en oefen je tot slot de belangrijke vaardigheid om resultaten te rapporteren aan een niet-technisch publiek.

Exercise 1: Onder de Bayesiaanse motorkap Exercise 2: Op weg naar grid-approximatie

Huidige oefening

Exercise 3: Rasterbenadering zonder voorkennis Exercise 4: Posterior bijwerken Exercise 5: A-prioriverwachting Exercise 6: De waarheid van de prior Exercise 7: De juiste prior kiezen Exercise 8: Posterior-trekkingen simuleren Exercise 9: Bayesiaanse resultaten rapporteren Exercise 10: Puntschattingen Exercise 11: Highest Posterior Density-credible intervals Exercise 12: De betekenis van geloofwaardigheid

Pas je nieuw verworven vaardigheden in Bayesiaanse data-analyse toe om echte zakelijke uitdagingen op te lossen. Je werkt met online marketing- en verkoopgegevens om A/B-testen, beslissingsanalyse en forecasting met lineaire regressiemodellen uit te voeren.

Exercise 1: A/B-testen Exercise 2: Simuleer beta-posterieur Exercise 3: Posterior klikpercentages Exercise 4: A of B, en hoe zeker zijn we?Exercise 5: Hoe erg kan het zijn?Exercise 6: Beslissingsanalyse Exercise 7: Beslissingsanalyse: kosten Exercise 8: Beslissingsanalyse: winst Exercise 9: Regressie en forecasting Exercise 10: Een Bayesiaans regressiemodel definiëren Exercise 11: Regressieparameters analyseren Exercise 12: Predictieve verdeling

In dit laatste hoofdstuk maak je gebruik van het krachtige PyMC3-pakket om eenvoudig Bayesiaanse regressiemodellen te fitten, sanity checks op de convergentie van een model uit te voeren, te kiezen tussen concurrerende modellen en voorspellingen voor nieuwe data te genereren. Ter afsluiting pas je wat je hebt geleerd toe om de optimale prijs voor avocado’s te vinden in een Bayesiaanse data-analysecasus. Succes!

Exercise 1: Markovketen-Monte Carlo en het fitten van modellen Exercise 2: Markov Chain Monte Carlo Exercise 3: Steekproeven trekken uit de posterior Exercise 4: Resultaten interpreteren en modellen vergelijken Exercise 5: Posterior-trekkingen inspecteren Exercise 6: Modellen vergelijken met WAIC Exercise 7: Voorspellingen maken Exercise 8: Steekproeven uit predictieve dichtheid Exercise 9: Testfout inschatten Exercise 10: Wat kost een avocado?Exercise 11: Het model fitten Exercise 12: Het model inspecteren Exercise 13: De prijs optimaliseren Exercise 14: Tot slot