Statistik Uji dan Ukuran Efek
Bagaimana kita dapat mengeksplorasi hubungan linear dengan bootstrap resampling? Kembali ke jalur! Untuk setiap pendakian yang diplot sebagai satu titik, terlihat ada hubungan linear antara total jarak tempuh dan waktu yang berlalu. Jika kita memperlakukan jarak tempuh sebagai "efek" dari waktu yang berlalu, maka kita dapat menelusuri kaitan antara regresi linear dan inferensi statistik.
Dalam latihan ini, Anda akan memisahkan data menjadi dua populasi, atau "kategori": waktu awal dan waktu akhir. Lalu Anda akan melihat perbedaan antara total jarak tempuh dalam masing-masing populasi. Perbedaan ini akan berfungsi sebagai "statistik uji", dan distribusinya akan menguji efek pemisahan jarak berdasarkan waktu.

Latihan ini adalah bagian dari kursus
Pengantar Pemodelan Linear di Python
Petunjuk latihan
- Gunakan "indeks logis"
numpy, misalnyasample_distances[sample_times < 5], untuk memisahkandistancessampel menjadi populasi waktu awal dan waktu akhir. - Gunakan
np.random.choice()denganreplacement=Trueuntuk membuatresamplebagi masing-masing dari dua kelompok waktu. - Hitung array
test_statisticsebagairesample_long - resample_short, lalu temukan dan cetak ukuran efek dan ketidakpastiannya dengannp.mean(),np.std(). - Plot distribusi
test_statistic, menggunakan fungsi yang sudah disiapkanfig = plot_test_statistic().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create two poulations, sample_distances for early and late sample_times.
# Then resample with replacement, taking 500 random draws from each population.
group_duration_short = sample_distances[____ < 5]
group_duration_long = sample_distances[____ > 5]
resample_short = np.random.choice(____, size=500, replace=____)
resample_long = np.random.choice(____, size=500, replace=____)
# Difference the resamples to compute a test statistic distribution, then compute its mean and stdev
test_statistic = resample_long - resample_short
effect_size = np.mean(____)
standard_error = np.std(____)
# Print and plot the results
print('Test Statistic: mean={:0.2f}, stdev={:0.2f}'.format(____, ____))
fig = plot_test_statistic(____)