IniziaInizia gratis

Valutare l’adattamento di distribuzione per la variabile ldl

In questo esercizio ti concentrerai su una variabile dell’insieme di dati sul diabete dia: il colesterolo LDL nel siero (ldl). Determinerai se la distribuzione normale è ancora una buona scelta per ldl sulla base delle informazioni aggiuntive fornite da un test di Kolmogorov–Smirnov.

Il DataFrame dia è già stato caricato per te. Sono state anche importate le seguenti librerie: pandas come pd, numpy come np e scipy.stats come st.

Questo esercizio fa parte del corso

Simulazioni Monte Carlo in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Definisci una lista chiamata list_of_dists contenente le distribuzioni candidate: Laplace, normale ed esponenziale (in quest’ordine); usa i nomi corretti di scipy.stats.
  • All’interno del ciclo, adatta i dati con la distribuzione di probabilità corrispondente, salvando in param.
  • Esegui un test di Kolmogorov–Smirnov per valutare il goodness-of-fit, salvando i risultati in result.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
    dist = getattr(st, i)
    # Fit the data to the probability distribution
    param = dist.____
    # Perform the ks test to evaluate goodness-of-fit
    result = ____
    print(result)
Modifica ed esegui il codice