Valutare l’adattamento di distribuzione per la variabile ldl
In questo esercizio ti concentrerai su una variabile dell’insieme di dati sul diabete dia: il colesterolo LDL nel siero (ldl). Determinerai se la distribuzione normale è ancora una buona scelta per ldl sulla base delle informazioni aggiuntive fornite da un test di Kolmogorov–Smirnov.
Il DataFrame dia è già stato caricato per te. Sono state anche importate le seguenti librerie: pandas come pd, numpy come np e scipy.stats come st.
Questo esercizio fa parte del corso
Simulazioni Monte Carlo in Python
Istruzioni dell'esercizio
- Definisci una lista chiamata
list_of_distscontenente le distribuzioni candidate: Laplace, normale ed esponenziale (in quest’ordine); usa i nomi corretti discipy.stats. - All’interno del ciclo, adatta i dati con la distribuzione di probabilità corrispondente, salvando in
param. - Esegui un test di Kolmogorov–Smirnov per valutare il goodness-of-fit, salvando i risultati in
result.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
dist = getattr(st, i)
# Fit the data to the probability distribution
param = dist.____
# Perform the ks test to evaluate goodness-of-fit
result = ____
print(result)