MulaiMulai sekarang secara gratis

Mengevaluasi kecocokan distribusi untuk variabel ldl

Pada latihan ini, Anda akan berfokus pada satu variabel dari himpunan data diabetes dia: serum darah ldl. Anda akan menentukan apakah distribusi normal masih merupakan pilihan yang baik untuk ldl berdasarkan informasi tambahan dari uji Kolmogorov–Smirnov.

DataFrame dia telah dimuat untuk Anda. Pustaka berikut juga telah diimpor: pandas sebagai pd, numpy sebagai np, dan scipy.stats sebagai st.

Latihan ini adalah bagian dari kursus

Simulasi Monte Carlo di Python

Lihat Kursus

Petunjuk latihan

  • Definisikan sebuah list bernama list_of_dists yang berisi kandidat distribusi: Laplace, normal, dan eksponensial (dalam urutan tersebut); gunakan nama yang benar dari scipy.stats.
  • Di dalam loop, lakukan fitting data dengan distribusi peluang yang sesuai, simpan sebagai param.
  • Lakukan uji Kolmogorov–Smirnov untuk mengevaluasi goodness-of-fit, simpan hasilnya sebagai result.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
    dist = getattr(st, i)
    # Fit the data to the probability distribution
    param = dist.____
    # Perform the ks test to evaluate goodness-of-fit
    result = ____
    print(result)
Edit dan Jalankan Kode