MulaiMulai sekarang secara gratis

Distribusi sampling normal

Anda ingin memperkirakan harga penutupan rata-rata yang realistis untuk S&P 500 pada sebagian periode perdagangannya. Ini tampak seperti penerapan alami dari interval kepercayaan, karena Anda memiliki statistik sampel dan ingin menggunakannya untuk memperkirakan statistik populasi. Namun, langkah pertama Anda adalah memeriksa apakah distribusi samplingnya mendekati normal. Pada latihan ini, Anda akan melakukan hal tersebut. Pada latihan berikutnya, Anda akan menggunakan hasil ini untuk membuat interval kepercayaan.

Data yang sama btc_sp_df sudah dimuat untuk Anda, begitu juga paket pandas sebagai pd, NumPy sebagai np, dan Matplotlib sebagai plt.

Latihan ini adalah bagian dari kursus

Dasar-dasar Inferensi di Python

Lihat Kursus

Petunjuk latihan

  • Definisikan variabel num_samples sebagai jumlah sampel yang diinginkan (200), dan definisikan list kosong sample_means untuk menyimpan mean dari masing-masing 200 sampel.
  • Tulis loop for yang akan mengulang proses pengambilan sampel sebanyak num_samples kali.
  • Pilih 500 harga penutupan S&P500 secara acak dari kolom Close_SP500 pada btc_sp_df.
  • Hitung mean dari setiap sampel tersebut dan simpan ke dalam sample_means.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Define the number of samples to take and store the sample means
num_samples = ____
sample_means = ____

# Write a for loop which repeats the sampling num_samples times
for i in ____:
  # Select 500 random Close_SP500 prices 
  sp500_sample = np.___(____, size=____)
  # Compute mean closing price and save it to sample_means
  ____.append(____.mean())
    
plt.hist(sample_means)
plt.show()
Edit dan Jalankan Kode