Probeer andere kandidaatverdelingen
Een goede keuze van invoer-kansverdelingen is cruciaal voor Monte Carlo-simulaties. In de video zijn drie verdelingen geëvalueerd om te bepalen welke het beste past bij de variabele age. Dat waren de Laplace-, normale en exponentiële verdeling. De normale verdeling bleek het beste te passen.
In deze oefening kijk je of je een verdeling kunt vinden die nóg beter past dan de normale verdeling! Je beoordeelt de passing van de uniforme, normale en exponentiële verdeling. De diabetesgegevensset is geladen als DataFrame dia. Blijft de normale verdeling de beste?
De volgende bibliotheken zijn al voor je geïmporteerd: pandas als pd, scipy.stats als st en numpy als np.
Deze oefening maakt deel uit van de cursus
Monte Carlo-simulaties in Python
Oefeninstructies
- Gebruik
.fit()om een verdeling te fitten op deage-gegevens; gebruik daarna.nnlf()om de Maximum Likelihood Estimation (MLE)-waarde van de fit te verkrijgen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
distributions = [st.uniform, st.norm, st.expon]
mles = []
for distribution in distributions:
# Fit the distribution and obtain the MLE value
pars = distribution.____
mle = distribution.____
mles.append(mle)
print(mles)