Distribusi sampling normal
Anda ingin memperkirakan harga penutupan rata-rata yang realistis untuk S&P 500 pada sebagian periode perdagangannya. Ini tampak seperti penerapan alami dari interval kepercayaan, karena Anda memiliki statistik sampel dan ingin menggunakannya untuk memperkirakan statistik populasi. Namun, langkah pertama Anda adalah memeriksa apakah distribusi samplingnya mendekati normal. Pada latihan ini, Anda akan melakukan hal tersebut. Pada latihan berikutnya, Anda akan menggunakan hasil ini untuk membuat interval kepercayaan.
Data yang sama btc_sp_df sudah dimuat untuk Anda, begitu juga paket pandas sebagai pd, NumPy sebagai np, dan Matplotlib sebagai plt.
Latihan ini adalah bagian dari kursus
Dasar-dasar Inferensi di Python
Petunjuk latihan
- Definisikan variabel
num_samplessebagai jumlah sampel yang diinginkan (200), dan definisikan list kosongsample_meansuntuk menyimpan mean dari masing-masing 200 sampel. - Tulis loop
foryang akan mengulang proses pengambilan sampel sebanyaknum_sampleskali. - Pilih 500 harga penutupan S&P500 secara acak dari kolom
Close_SP500padabtc_sp_df. - Hitung mean dari setiap sampel tersebut dan simpan ke dalam
sample_means.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define the number of samples to take and store the sample means
num_samples = ____
sample_means = ____
# Write a for loop which repeats the sampling num_samples times
for i in ____:
# Select 500 random Close_SP500 prices
sp500_sample = np.___(____, size=____)
# Compute mean closing price and save it to sample_means
____.append(____.mean())
plt.hist(sample_means)
plt.show()