Mengevaluasi kecocokan distribusi untuk variabel ldl
Pada latihan ini, Anda akan berfokus pada satu variabel dari himpunan data diabetes dia: serum darah ldl. Anda akan menentukan apakah distribusi normal masih merupakan pilihan yang baik untuk ldl berdasarkan informasi tambahan dari uji Kolmogorov–Smirnov.
DataFrame dia telah dimuat untuk Anda. Pustaka berikut juga telah diimpor: pandas sebagai pd, numpy sebagai np, dan scipy.stats sebagai st.
Latihan ini adalah bagian dari kursus
Simulasi Monte Carlo di Python
Petunjuk latihan
- Definisikan sebuah list bernama
list_of_distsyang berisi kandidat distribusi: Laplace, normal, dan eksponensial (dalam urutan tersebut); gunakan nama yang benar dariscipy.stats. - Di dalam loop, lakukan fitting data dengan distribusi peluang yang sesuai, simpan sebagai
param. - Lakukan uji Kolmogorov–Smirnov untuk mengevaluasi goodness-of-fit, simpan hasilnya sebagai
result.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
dist = getattr(st, i)
# Fit the data to the probability distribution
param = dist.____
# Perform the ks test to evaluate goodness-of-fit
result = ____
print(result)