MulaiMulai sekarang secara gratis

Statistik Uji dan Ukuran Efek

Bagaimana kita dapat mengeksplorasi hubungan linear dengan bootstrap resampling? Kembali ke jalur! Untuk setiap pendakian yang diplot sebagai satu titik, terlihat ada hubungan linear antara total jarak tempuh dan waktu yang berlalu. Jika kita memperlakukan jarak tempuh sebagai "efek" dari waktu yang berlalu, maka kita dapat menelusuri kaitan antara regresi linear dan inferensi statistik.

Dalam latihan ini, Anda akan memisahkan data menjadi dua populasi, atau "kategori": waktu awal dan waktu akhir. Lalu Anda akan melihat perbedaan antara total jarak tempuh dalam masing-masing populasi. Perbedaan ini akan berfungsi sebagai "statistik uji", dan distribusinya akan menguji efek pemisahan jarak berdasarkan waktu.

ch04_ex11_fig03.png

Latihan ini adalah bagian dari kursus

Pengantar Pemodelan Linear di Python

Lihat Kursus

Petunjuk latihan

  • Gunakan "indeks logis" numpy, misalnya sample_distances[sample_times < 5], untuk memisahkan distances sampel menjadi populasi waktu awal dan waktu akhir.
  • Gunakan np.random.choice() dengan replacement=True untuk membuat resample bagi masing-masing dari dua kelompok waktu.
  • Hitung array test_statistic sebagai resample_long - resample_short, lalu temukan dan cetak ukuran efek dan ketidakpastiannya dengan np.mean(), np.std().
  • Plot distribusi test_statistic, menggunakan fungsi yang sudah disiapkan fig = plot_test_statistic().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create two poulations, sample_distances for early and late sample_times.
# Then resample with replacement, taking 500 random draws from each population.
group_duration_short = sample_distances[____ < 5]
group_duration_long = sample_distances[____ > 5]
resample_short = np.random.choice(____, size=500, replace=____)
resample_long = np.random.choice(____, size=500, replace=____)

# Difference the resamples to compute a test statistic distribution, then compute its mean and stdev
test_statistic = resample_long - resample_short
effect_size = np.mean(____)
standard_error = np.std(____)

# Print and plot the results
print('Test Statistic: mean={:0.2f}, stdev={:0.2f}'.format(____, ____))
fig = plot_test_statistic(____)
Edit dan Jalankan Kode