Çoklu karşılaştırmalar sorunu

Çoklu karşılaştırmalar sorunu, bir araştırmacı farklı değişken/örnek çiftlerini anlamlılık açısından tekrar tekrar test ettiğinde ortaya çıkar. Sırf rastlantı nedeniyle ara sıra istatistiksel olarak anlamlı bir sonuç bulmayı bekleriz.

Bu egzersizde Teksas, Austin Şehri çalışanlarının maaş verileriyle çalışacaksın. Maaşlarını rastgele üretilmiş verilerle karşılaştıracaksın. Bu rastgele verilerin çalışanların maaşlarını açıklamada ne sıklıkla "anlamlı" göründüğünü göreceksin. Elbette böyle bir "anlamlılık" sahte olacaktır; çünkü rastgele sayılar genellikle hiçbir şeyi açıklamakta işe yaramaz!

Polis memurlarının maaşlarına ait bir DataFrame (police_salaries_df) senin için yüklendi; ayrıca paketler olarak pandas pd, NumPy np, Matplotlib plt ve SciPy'dan stats hazır.

Bu egzersiz, kursun bir parçasıdır

Python'da Çıkarımın Temelleri

Kursa Göz Atın

Egzersiz talimatları

Veri kümesindeki kişi sayısını (her satır bir kişidir) n_rows içinde sakla ve anlamlı sonuç sayısını tutan n_significant değişkenini sıfırla başlat.
1000 kez çalışan ve her seferinde n_rows adet rastgele sayı üreten bir for döngüsü yaz.
Bu rastgele üretilen sayılar ile polis memuru maaşları arasındaki Pearson R ve ilgili p-değerini hesapla.
p-değeri %5 düzeyinde anlamlıysa, += operatörünü kullanarak n_significant değerini bir artır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Compute number of rows and initialize n_significant
n_rows = ____
n_significant = ____

# For loop which generates n_rows random numbers 1000 times
for i in ____:
  random_nums = np.random.uniform(size=____)
  # Compute correlation between random_nums and police salaries
  r, p_value = stats.____(____, random_nums)
  # If the p-value is significant at 5%, increment n_significant
  if ____ < ____:
    ____ += 1
    
print(n_significant)

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

Python'da Çıkarımın Temelleri

AvançadoNível de habilidade

4.9+

Kursa Ücretsiz Başla

Bu bölümde, örnekler ile istatistiksel olarak gerekçelendirilebilir sonuçlar arasındaki ilişkiyi keşfedeceğiz. Örnek seçimi, sağlam istatistiksel kararların temelidir ve bir örnek seçiminin çıkarımının sonucunu nasıl etkilediğini inceleyeceğiz.

Exercise 1: İstatistiksel çıkarım ve rastgele örnekleme Exercise 2: Örnekleme ve nokta tahminleri Exercise 3: Tekrarlı örnekleme, nokta tahminleri ve çıkarım Exercise 4: Örnekleme ve yanlılık Exercise 5: Örnekleri görselleştirme Exercise 6: Çıkarım ve yanlılık Exercise 7: Güven aralıkları ve örnekleme Exercise 8: Normal örnekleme dağılımları Exercise 9: Güven aralıklarını hesaplamak Exercise 10: Örneklerden sonuç çıkarma

Sağlam çıkarım için normallik testleri, korelasyon testleri ile parametrik ve parametrik olmayan testlerin uygulanması hakkında her şeyi öğren. Hipotez testleri birer araçtır ve işe uygun doğru aracı seçmek istatistiksel karar verme için kritiktir. Bu testlerin bazılarına giriş derslerinde aşina olabilirsin; bu bölümde daha derine inerek çıkarımsal araç kutunu zenginleştireceksin.

Exercise 1: Normallik testleri Exercise 2: Normallik testi Exercise 3: Hataların dağılımı Exercise 4: Normal dağılım uydurma Exercise 5: Korelasyon testleri Exercise 6: Korelasyon testi Exercise 7: Otokorelasyon Exercise 8: Açıklanan varyans Exercise 9: Parametrik testler Exercise 10: Eşit varyans Exercise 11: Grupların normalliği Exercise 12: ANOVA Exercise 13: Parametrik olmayan testler Exercise 14: Sıralamaları karşılaştırma Exercise 15: Medyanları karşılaştırma

Bu bölümde, çeşitli durumlarda etki büyüklüğünü ölçecek ve yorumlayacak, çoklu karşılaştırmalar sorunuyla karşılaşacak ve bir testin gücünü derinlemesine inceleyeceksin. p-değerleri anlamlı bir etkinin olup olmadığını söyler, ancak bu etkinin ne kadar güçlü olduğunu söylemez. Etki büyüklüğü, bir işlemin ne kadar güçlü bir etki yarattığını ölçer. Bu bölümde etki büyüklüğünü belirleyen etmenlere hâkim olacaksın.

Exercise 1: Etki büyüklüğü Exercise 2: Ortalamalar için etki büyüklüğü Exercise 3: Korelasyonlar için etki büyüklüğü Exercise 4: Kategorik değişkenler için etki büyüklüğü Exercise 5: Çoklu karşılaştırmalar ve düzeltmeler Exercise 6: Çoklu karşılaştırmalar sorunu

Geçerli egzersiz

Exercise 7: Bonferonni-Holm düzeltmesi Exercise 8: Bir testin gücü Exercise 9: Güç (power) tam olarak nedir?Exercise 10: Deney tasarımı için güç Exercise 11: Güç ve örneklem büyüklüklerini hesaplama

Çıkarımsal istatistik araç kutunu önyükleme (bootstrapping), permütasyon testleri ve p-değerlerinden kanıt birleştirme yöntemleriyle daha da genişleteceksin. Önyükleme, istatistiksel benzetime ilk bakışını sağlayacak. Meta-analiz dersinde, birden çok çalışmanın sonuçlarını birleştirmeyi en ince ayrıntısına kadar öğreneceksin. Güçlü ve esnek bir parametrik olmayan istatistiksel araç olan permütasyon testlerine bakarak tamamlayacaksın.

Exercise 1: Bootstrap (Örneklem Yenidenleme)Exercise 2: Bootstrap güven aralıkları Exercise 3: Bootstrap ile normallik karşılaştırması Exercise 4: p-değerlerinden kanıtları birleştirme Exercise 5: SciPy'da Fisher yöntemi Exercise 6: Fisher yöntemiyle çıkarım Exercise 7: Fisher yönteminin özetlenmesi Exercise 8: Permütasyon testleri Exercise 9: Korelasyonlar için permütasyon testleri Exercise 10: Permütasyon testleri ve bootstrapping Exercise 11: Eğri (çarpık) veriyi permütasyon testiyle analiz etme Exercise 12: Kurs kapanış videosu