BaşlayınÜcretsiz Başlayın

K-S istatistiğini hesaplama

İki veri kümesinden, data1 ve data2, Kolmogorov–Smirnov istatistiğini hesaplayan bir fonksiyon yaz. Burada data2, verilerini karşılaştırdığın teorik dağılımdan örnekler içeriyor. Bu da, iki ampirik veri kümesi için değil, bir veri kümesi ile teorik bir dağılım için K-S istatistiğini hacker istatistikleriyle hesapladığımız anlamına gelir. Neyse ki, az önce seçtiğin ve biçimsel ECDF değerlerini hesaplayan fonksiyon dcst.ecdf_formal() olarak verilmiştir.

Bu egzersiz

İstatistiksel Düşünmede Vaka Çalışmaları

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • dcst.ecdf() kullanarak data1 için biçimsel ECDF'nin dışbükey köşelerinin değerlerini hesapla. Sonuçları x ve y değişkenlerinde sakla.
  • dcst.ecdf_formal() kullanarak, data2 ile belirlenen teorik KDA'nın, dışbükey köşeler x'teki değerlerini hesapla. Sonucu cdf değişkeninde sakla.
  • Biçimsel ECDF'nin içbükey köşeleri ile teorik KDA arasındaki mesafeleri hesapla. Sonucu D_top olarak sakla.
  • Biçimsel ECDF'nin dışbükey köşeleri ile teorik KDA arasındaki mesafeyi hesapla. Dışbükey köşedeki y değerini elde etmek için y'den 1/len(data1) çıkarman gerektiğini unutma. Sonucu D_bottom'da sakla.
  • K-S istatistiğini, D_top ve D_bottom içindeki tüm değerlerin maksimumu olarak döndür. Bunu yapmak için D_top ve D_bottom'ı bir demet (tuple) olarak birlikte np.max()'e geçebilirsin.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

def ks_stat(data1, data2):
    # Compute ECDF from data: x, y
    
    
    # Compute corresponding values of the target CDF
    cdf = ____

    # Compute distances between concave corners and CDF
    D_top = ____ - ____

    # Compute distance between convex corners and CDF
    D_bottom = ____ - ____ + ____/____

    return np.max((D_top, D_bottom))
Kodu Düzenle ve Çalıştır