Variasi dalam Statistik Sampel

Jika kita membuat satu sampel dengan size=1000 dengan mengambil sejumlah titik tersebut dari sebuah populasi, lalu menghitung sebuah statistik sampel seperti mean, kita memperoleh satu nilai yang merangkum sampel itu sendiri.

Jika Anda mengulangi proses pengambilan sampel tersebut num_samples=100 kali, Anda akan mendapatkan 100 sampel. Menghitung statistik sampel, seperti mean, untuk masing-masing sampel akan menghasilkan sebuah sebaran nilai mean. Tujuannya adalah menghitung mean dari mean-mean tersebut dan simpangan baku dari mean-mean tersebut.

Di sini Anda akan menggunakan population, num_samples, dan num_pts yang sudah dimuat, dan perhatikan bahwa array means dan deviations telah diinisialisasi dengan nol sebagai wadah yang akan Anda gunakan dalam perulangan for.

Latihan ini merupakan bagian dari kursus

Pengantar Pemodelan Linear di Python

Instruksi latihan

Untuk masing-masing dari num_samples=100, buat sebuah sampel, lalu hitung dan simpan statistik sampelnya.
Pada setiap iterasi, buat sample dengan menggunakan np.random.choice() untuk mengambil 1000 titik acak dari populasi.
Pada setiap iterasi, hitung dan simpan hasil metode sample.mean() dan sample.std() untuk memperoleh mean dan simpangan baku dari sampel.
Untuk array means dan array deviations, hitung mean dan simpangan baku dari masing-masing array, lalu cetak hasilnya.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Initialize two arrays of zeros to be used as containers
means = np.zeros(num_samples)
stdevs = np.zeros(num_samples)

# For each iteration, compute and store the sample mean and sample stdev
for ns in range(num_samples):
    sample = np.____.choice(population, num_pts)
    means[ns] = sample.____()
    stdevs[ns] = sample.____()

# Compute and print the mean() and std() for the sample statistic distributions
print("Means:  center={:>6.2f}, spread={:>6.2f}".format(means.mean(), means.std()))
print("Stdevs: center={:>6.2f}, spread={:>6.2f}".format(stdevs.____(), stdevs.____()))

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Pengantar Pemodelan Linear di Python

SkillTag.level.intermediateSkillTag.label

4.7+

Mulai Kursus Gratis

Kita memulai kursus dengan eksplorasi awal terhadap hubungan linear, termasuk beberapa contoh pemicu tentang bagaimana model linear digunakan, serta demonstrasi metode visualisasi data dari matplotlib. Selanjutnya kita menggunakan statistik deskriptif untuk mengkuantifikasi bentuk data dan menggunakan korelasi untuk mengukur kekuatan hubungan linear antara dua variabel.

Exercise 1: Pengantar Pemodelan Data Exercise 2: Alasan Melakukan Pemodelan: Interpolasi Exercise 3: Alasan Melakukan Pemodelan: Ekstrapolasi Exercise 4: Alasan Melakukan Pemodelan: Mengestimasi Hubungan Exercise 5: Memvisualisasikan Hubungan Linear Exercise 6: Memplot Data Exercise 7: Memplot Model pada Data Exercise 8: Mengestimasi Kemiringan & Intersep Secara Visual Exercise 9: Mengkuantifikasi Hubungan Linear Exercise 10: Mean, Deviasi, & Standar Deviasi Exercise 11: Kovarians vs Korelasi Exercise 12: Kekuatan Korelasi

Di sini kita melihat komponen yang membentuk sebuah model linear. Menggunakan konsep Deret Taylor, kita berfokus pada parameter kemiringan (slope) dan intersep, bagaimana keduanya mendefinisikan model, serta cara menafsirkannya dalam berbagai konteks terapan. Kita menerapkan beragam modul Python untuk menemukan model yang paling sesuai dengan data, dengan menghitung nilai optimal dari kemiringan dan intersep menggunakan least-squares, numpy, statsmodels, dan scikit-learn.

Exercise 1: Apa yang membuat sebuah model linear Exercise 2: Suku dalam sebuah Model Exercise 3: Komponen Model Exercise 4: Parameter Model Exercise 5: Menafsirkan Kemiringan dan Intersep Exercise 6: Proporsionalitas Linear Exercise 7: Kemiringan dan Laju Perubahan Exercise 8: Intersep dan Titik Awal Exercise 9: Optimisasi Model Exercise 10: Residual Sum of the Squares Exercise 11: Meminimalkan Residual Exercise 12: Memvisualisasikan Minimum RSS Exercise 13: Optimisasi Kuadrat Terkecil Exercise 14: Kuadrat Terkecil dengan `numpy`Exercise 15: Optimisasi dengan Scipy Exercise 16: Kuadrat Terkecil dengan `statsmodels`

Berikutnya kita akan menerapkan model pada data nyata dan membuat prediksi. Kita akan mengeksplorasi beberapa jebakan umum dan keterbatasan prediksi, serta mengevaluasi dan membandingkan model dengan mengkuantifikasi dan mengontraskan sejumlah ukuran goodness-of-fit, termasuk RMSE dan R-squared.

Exercise 1: Pemodelan Data Nyata Exercise 2: Model Linear dalam Antropologi Exercise 3: Model Linear dalam Oseanografi Exercise 4: Model Linear dalam Kosmologi Exercise 5: Batas Prediksi Exercise 6: Interpolasi: Waktu di Antara Exercise 7: Ekstrapolasi: Melewati Batas Exercise 8: Kebaikan-Sesuai (Goodness-of-Fit)Exercise 9: RMSE langkah demi langkah Exercise 10: R-Squared Exercise 11: Galat Baku Exercise 12: Variasi di Sekitar Tren Exercise 13: Variasi dalam Dua Bagian

Pada bab terakhir, kita memperkenalkan konsep dari statistika inferensial, dan menggunakannya untuk mengeksplorasi bagaimana maximum likelihood estimation dan bootstrap resampling dapat digunakan untuk mengestimasi parameter model linear. Kemudian kita menerapkan metode ini untuk membuat pernyataan probabilistik tentang keyakinan kita terhadap parameter model.

Exercise 1: Konsep Statistik Inferensial Exercise 2: Statistik Sampel versus Populasi Exercise 3: Variasi dalam Statistik Sampel

Latihan Saat Ini

Exercise 4: Memvisualisasikan Variasi Suatu Statistik Exercise 5: Estimasi Model dan Likelihood Exercise 6: Estimasi Parameter Populasi Exercise 7: Memaksimalkan Likelihood, Bagian 1 Exercise 8: Memaksimalkan Likelihood, Bagian 2 Exercise 9: Ketidakpastian Model dan Distribusi Sampel Exercise 10: Bootstrap dan Standard Error Exercise 11: Mengestimasi Kecepatan dan Kepercayaan Exercise 12: Visualisasikan Bootstrap Exercise 13: Kesalahan Model dan Keacakan Exercise 14: Statistik Uji dan Ukuran Efek Exercise 15: Hipotesis Nol Exercise 16: Memvisualisasikan Statistik Uji Exercise 17: Memvisualisasikan P-Value Exercise 18: Penutup Kursus