Probeer andere kandidaatverdelingen

Een goede keuze van invoer-kansverdelingen is cruciaal voor Monte Carlo-simulaties. In de video zijn drie verdelingen geëvalueerd om te bepalen welke het beste past bij de variabele age. Dat waren de Laplace-, normale en exponentiële verdeling. De normale verdeling bleek het beste te passen.

In deze oefening kijk je of je een verdeling kunt vinden die nóg beter past dan de normale verdeling! Je beoordeelt de passing van de uniforme, normale en exponentiële verdeling. De diabetesgegevensset is geladen als DataFrame dia. Blijft de normale verdeling de beste?

De volgende bibliotheken zijn al voor je geïmporteerd: pandas als pd, scipy.stats als st en numpy als np.

Deze oefening maakt deel uit van de cursus

Monte Carlo-simulaties in Python

Bekijk cursus

Oefeninstructies

Gebruik .fit() om een verdeling te fitten op de age-gegevens; gebruik daarna .nnlf() om de Maximum Likelihood Estimation (MLE)-waarde van de fit te verkrijgen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

distributions = [st.uniform, st.norm, st.expon]
mles = []
for distribution in distributions:
    # Fit the distribution and obtain the MLE value
    pars = distribution.____
    mle = distribution.____
    mles.append(mle)
print(mles)

Code bewerken en uitvoeren