Masalah perbandingan berganda

Masalah perbandingan berganda muncul ketika peneliti berulang kali memeriksa variabel/sampel yang berbeda satu sama lain untuk melihat signifikansinya. Hanya karena kebetulan saja, kita berharap sesekali menemukan hasil yang signifikan secara statistik.

Dalam latihan ini Anda akan bekerja dengan data gaji karyawan di City of Austin, TX. Anda akan membandingkan gaji mereka dengan data yang dihasilkan secara acak. Anda akan melihat seberapa sering data acak ini "signifikan" dalam menjelaskan gaji karyawan. Jelas bahwa setiap "signifikansi" semacam itu adalah semu, karena angka acak tidak terlalu membantu menjelaskan apa pun!

Sebuah DataFrame berisi gaji petugas polisi (police_salaries_df) telah dimuat untuk Anda, begitu juga paket pandas sebagai pd, NumPy sebagai np, Matplotlib sebagai plt, dan stats dari SciPy.

Latihan ini merupakan bagian dari kursus

Dasar-dasar Inferensi di Python

Instruksi latihan

Simpan jumlah orang dalam himpunan data ke n_rows (setiap baris mewakili satu orang), dan inisialisasi jumlah hasil signifikan, n_significant, ke nol.
Tulis for loop yang berjalan 1000 kali dan menghasilkan n_rows angka acak.
Hitung Pearson's R dan p-value terkait antara angka acak yang dihasilkan ini dan gaji petugas polisi.
Jika p-value signifikan pada 5%, tambahkan satu ke n_significant menggunakan operator +=.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Compute number of rows and initialize n_significant
n_rows = ____
n_significant = ____

# For loop which generates n_rows random numbers 1000 times
for i in ____:
  random_nums = np.random.uniform(size=____)
  # Compute correlation between random_nums and police salaries
  r, p_value = stats.____(____, random_nums)
  # If the p-value is significant at 5%, increment n_significant
  if ____ < ____:
    ____ += 1
    
print(n_significant)

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Dasar-dasar Inferensi di Python

SkillTag.level.advancedSkillTag.label

4.9+

Mulai Kursus Gratis

Pada bab ini, kita akan menelaah hubungan antara sampel dan kesimpulan yang dapat dipertanggungjawabkan secara statistik. Memilih sampel adalah dasar dalam membuat keputusan statistik yang kuat, dan kita akan membahas bagaimana pilihan sampel memengaruhi hasil inferensi Anda.

Exercise 1: Inferensi statistik dan pengambilan sampel acak Exercise 2: Sampling dan estimasi titik Exercise 3: Pengambilan sampel berulang, estimasi titik, dan inferensi Exercise 4: Pengambilan Sampel dan Bias Exercise 5: Memvisualisasikan sampel Exercise 6: Inferensi dan bias Exercise 7: Interval kepercayaan dan pengambilan sampel Exercise 8: Distribusi sampling normal Exercise 9: Menghitung interval kepercayaan Exercise 10: Menarik kesimpulan dari sampel

Pelajari penerapan uji kenormalan, uji korelasi, serta uji parametrik dan nonparametrik untuk menghasilkan inferensi yang kuat. Uji hipotesis adalah seperangkat alat, dan memilih alat yang tepat untuk tugasnya sangat penting bagi pengambilan keputusan statistik. Meskipun Anda mungkin telah mengenal beberapa uji ini di kursus pengantar, pada bab ini Anda akan mendalaminya untuk memperkaya perangkat inferensial Anda.

Exercise 1: Uji normalitas Exercise 2: Menguji kenormalan Exercise 3: Distribusi galat Exercise 4: Menyesuaikan sebaran normal Exercise 5: Uji korelasi Exercise 6: Menguji korelasi Exercise 7: Autokorelasi Exercise 8: Varians terjelaskan Exercise 9: Uji parametrik Exercise 10: Varians sama Exercise 11: Kenormalan per kelompok Exercise 12: ANOVA Exercise 13: Uji nonparametrik Exercise 14: Membandingkan pemeringkatan Exercise 15: Membandingkan median

Pada bab ini, Anda akan mengukur dan menafsirkan ukuran efek dalam berbagai situasi, memahami masalah perbandingan berganda, dan menelaah daya uji secara mendalam. Meskipun p-value memberi tahu apakah ada efek yang signifikan, p-value tidak menunjukkan seberapa kuat efek tersebut. Ukuran efek mengukur seberapa kuat dampak suatu perlakuan. Kuasai faktor-faktor yang mendasari ukuran efek pada bab ini.

Exercise 1: Ukuran efek Exercise 2: Ukuran efek untuk mean Exercise 3: Ukuran efek untuk korelasi Exercise 4: Ukuran efek untuk variabel kategorikal Exercise 5: Perbandingan berganda dan koreksi Exercise 6: Masalah perbandingan berganda

Latihan Saat Ini

Exercise 7: Koreksi Bonferroni–Holm Exercise 8: Kekuatan suatu uji Exercise 9: Sebenarnya, apa itu power?Exercise 10: Power untuk perancangan eksperimen Exercise 11: Menghitung power dan ukuran sampel

Anda akan memperluas perangkat statistik inferensial dengan meninjau bootstrapping, uji permutasi, dan metode menggabungkan bukti dari p-value. Bootstrapping akan memberi Anda gambaran awal tentang simulasi statistik. Pada pelajaran meta-analisis, Anda akan mempelajari cara menggabungkan hasil dari banyak studi. Anda akan menutup dengan meninjau uji permutasi, alat statistik nonparametrik yang kuat dan fleksibel.

Exercise 1: Bootstrapping Exercise 2: Interval kepercayaan bootstrap Exercise 3: Bootstrapping vs. kenormalan Exercise 4: Menggabungkan bukti dari p-value Exercise 5: Metode Fisher di SciPy Exercise 6: Inferensi menggunakan Metode Fisher Exercise 7: Merangkum metode Fisher Exercise 8: Uji permutasi Exercise 9: Uji permutasi untuk korelasi Exercise 10: Uji permutasi dan bootstrapping Exercise 11: Menganalisis data miring dengan uji permutasi Exercise 12: Video penutup kursus