Variasi dalam Statistik Sampel
Jika kita membuat satu sampel dengan size=1000 dengan mengambil sejumlah titik tersebut dari sebuah populasi, lalu menghitung sebuah statistik sampel seperti mean, kita memperoleh satu nilai yang merangkum sampel itu sendiri.
Jika Anda mengulangi proses pengambilan sampel tersebut num_samples=100 kali, Anda akan mendapatkan 100 sampel. Menghitung statistik sampel, seperti mean, untuk masing-masing sampel akan menghasilkan sebuah sebaran nilai mean. Tujuannya adalah menghitung mean dari mean-mean tersebut dan simpangan baku dari mean-mean tersebut.
Di sini Anda akan menggunakan population, num_samples, dan num_pts yang sudah dimuat, dan perhatikan bahwa array means dan deviations telah diinisialisasi dengan nol sebagai wadah yang akan Anda gunakan dalam perulangan for.
Latihan ini adalah bagian dari kursus
Pengantar Pemodelan Linear di Python
Petunjuk latihan
- Untuk masing-masing dari
num_samples=100, buat sebuah sampel, lalu hitung dan simpan statistik sampelnya. - Pada setiap iterasi, buat
sampledengan menggunakannp.random.choice()untuk mengambil1000titik acak dari populasi. - Pada setiap iterasi, hitung dan simpan hasil metode
sample.mean()dansample.std()untuk memperoleh mean dan simpangan baku dari sampel. - Untuk array
meansdan arraydeviations, hitung mean dan simpangan baku dari masing-masing array, lalu cetak hasilnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Initialize two arrays of zeros to be used as containers
means = np.zeros(num_samples)
stdevs = np.zeros(num_samples)
# For each iteration, compute and store the sample mean and sample stdev
for ns in range(num_samples):
sample = np.____.choice(population, num_pts)
means[ns] = sample.____()
stdevs[ns] = sample.____()
# Compute and print the mean() and std() for the sample statistic distributions
print("Means: center={:>6.2f}, spread={:>6.2f}".format(means.mean(), means.std()))
print("Stdevs: center={:>6.2f}, spread={:>6.2f}".format(stdevs.____(), stdevs.____()))