Korelasi data anak dan induk
Untuk mengkuantifikasi korelasi antara kedalaman paruh anak dan induknya, kita ingin menghitung statistik seperti koefisien korelasi Pearson antara induk dan anak. Untuk mendapatkan interval kepercayaan, kita perlu melakukan pairs bootstrap.
Anda telah menulis sebuah fungsi untuk melakukan pairs bootstrap guna memperoleh taksiran parameter dari regresi linear. Tugas Anda dalam latihan ini adalah membuat fungsi baru dengan tanda panggilan draw_bs_pairs(x, y, func, size=1) yang melakukan pairs bootstrap dan menghitung satu statistik pada pasangan sampel yang didefinisikan. Statistik yang diminati dihitung dengan memanggil func(bs_x, bs_y). Pada latihan berikutnya, Anda akan menggunakan pearson_r sebagai func.
Latihan ini adalah bagian dari kursus
Pemikiran Statistik dengan Python (Bagian 2)
Petunjuk latihan
- Siapkan sebuah array indeks sebagai sumber pengambilan sampel. (Ingat, saat melakukan pairs bootstrap, kita memilih indeks secara acak dan menggunakannya untuk mendapatkan pasangan.)
- Inisialisasi array replikasi bootstrap. Ini harus berupa array satu dimensi dengan panjang
size. - Tulis loop
foruntuk menggambar sampel. - Pilih indeks secara acak dari array indeks yang telah Anda siapkan sebelumnya.
- Ekstrak nilai
xdan nilaiydari array masukan menggunakan indeks yang baru Anda pilih untuk menghasilkan sampel bootstrap. - Gunakan
funcuntuk menghitung statistik yang diminati dari sampel bootstrapxdany, lalu simpan ke dalam array replikasi bootstrap Anda. - Kembalikan array replikasi bootstrap tersebut.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def draw_bs_pairs(x, y, func, size=1):
"""Perform pairs bootstrap for a single statistic."""
# Set up array of indices to sample from: inds
inds = ____
# Initialize replicates: bs_replicates
bs_replicates = ____
# Generate replicates
for i in range(size):
bs_inds = ____
bs_x, bs_y = ____
bs_replicates[i] = ____
return bs_replicates