Memvisualisasikan P-Value

Dalam latihan ini, Anda akan memvisualisasikan p-value, yaitu peluang bahwa efek (atau "kecepatan") yang kita estimasi merupakan hasil variasi acak dalam sampel. Tujuan Anda adalah memvisualisasikannya sebagai fraksi titik dalam sebaran statistik uji yang diacak yang berada di sebelah kanan mean statistik uji ("ukuran efek") yang dihitung dari sampel yang tidak diacak.

Sebagai awalan, kami telah memuat group_duration_short dan group_duration_long serta fungsi compute_test_statistic(), shuffle_and_split(), dan plot_test_statistic_effect()

Latihan ini merupakan bagian dari kursus

Pengantar Pemodelan Linear di Python

Instruksi latihan

Gunakan compute_test_statistic() untuk memperoleh test_statistic_unshuffled dari group_duration_short dan group_duration_long; kemudian gunakan np.mean() untuk menghitung ukuran efek.
Gunakan shuffle_and_split() untuk membuat shuffle_half1 dan shuffle_half2, lalu gunakan compute_test_statistic() untuk menghitung test_statistic_shuffled.
Buat mask boolean condition sehingga nilai test_statistic_shuffled lebih besar atau sama dengan effect_size, lalu gunakan mask ini untuk menghitung p_value.
Cetak p_value dan plot kedua statistik uji menggunakan plot_test_statistic_effect().

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Compute the test stat distribution and effect size for two population groups
test_statistic_unshuffled = compute_test_statistic(____, ____)
effect_size = np.mean(____)

# Randomize the two populations, and recompute the test stat distribution
shuffled_half1, ____ = shuffle_and_split(group_duration_short, ____)
test_statistic_shuffled = compute_test_statistic(shuffled_half1, ____)

# Compute the p-value as the proportion of shuffled test stat values >= the effect size
condition = ____ >= ____
p_value = len(test_statistic_shuffled[____]) / len(test_statistic_shuffled)

# Print p-value and overplot the shuffled and unshuffled test statistic distributions
print("The p-value is = {}".format(____))
fig = plot_test_stats_and_pvalue(test_statistic_unshuffled, test_statistic_shuffled)

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Pengantar Pemodelan Linear di Python

SkillTag.level.intermediateSkillTag.label

4.7+

Mulai Kursus Gratis

Kita memulai kursus dengan eksplorasi awal terhadap hubungan linear, termasuk beberapa contoh pemicu tentang bagaimana model linear digunakan, serta demonstrasi metode visualisasi data dari matplotlib. Selanjutnya kita menggunakan statistik deskriptif untuk mengkuantifikasi bentuk data dan menggunakan korelasi untuk mengukur kekuatan hubungan linear antara dua variabel.

Exercise 1: Pengantar Pemodelan Data Exercise 2: Alasan Melakukan Pemodelan: Interpolasi Exercise 3: Alasan Melakukan Pemodelan: Ekstrapolasi Exercise 4: Alasan Melakukan Pemodelan: Mengestimasi Hubungan Exercise 5: Memvisualisasikan Hubungan Linear Exercise 6: Memplot Data Exercise 7: Memplot Model pada Data Exercise 8: Mengestimasi Kemiringan & Intersep Secara Visual Exercise 9: Mengkuantifikasi Hubungan Linear Exercise 10: Mean, Deviasi, & Standar Deviasi Exercise 11: Kovarians vs Korelasi Exercise 12: Kekuatan Korelasi

Di sini kita melihat komponen yang membentuk sebuah model linear. Menggunakan konsep Deret Taylor, kita berfokus pada parameter kemiringan (slope) dan intersep, bagaimana keduanya mendefinisikan model, serta cara menafsirkannya dalam berbagai konteks terapan. Kita menerapkan beragam modul Python untuk menemukan model yang paling sesuai dengan data, dengan menghitung nilai optimal dari kemiringan dan intersep menggunakan least-squares, numpy, statsmodels, dan scikit-learn.

Exercise 1: Apa yang membuat sebuah model linear Exercise 2: Suku dalam sebuah Model Exercise 3: Komponen Model Exercise 4: Parameter Model Exercise 5: Menafsirkan Kemiringan dan Intersep Exercise 6: Proporsionalitas Linear Exercise 7: Kemiringan dan Laju Perubahan Exercise 8: Intersep dan Titik Awal Exercise 9: Optimisasi Model Exercise 10: Residual Sum of the Squares Exercise 11: Meminimalkan Residual Exercise 12: Memvisualisasikan Minimum RSS Exercise 13: Optimisasi Kuadrat Terkecil Exercise 14: Kuadrat Terkecil dengan `numpy`Exercise 15: Optimisasi dengan Scipy Exercise 16: Kuadrat Terkecil dengan `statsmodels`

Berikutnya kita akan menerapkan model pada data nyata dan membuat prediksi. Kita akan mengeksplorasi beberapa jebakan umum dan keterbatasan prediksi, serta mengevaluasi dan membandingkan model dengan mengkuantifikasi dan mengontraskan sejumlah ukuran goodness-of-fit, termasuk RMSE dan R-squared.

Exercise 1: Pemodelan Data Nyata Exercise 2: Model Linear dalam Antropologi Exercise 3: Model Linear dalam Oseanografi Exercise 4: Model Linear dalam Kosmologi Exercise 5: Batas Prediksi Exercise 6: Interpolasi: Waktu di Antara Exercise 7: Ekstrapolasi: Melewati Batas Exercise 8: Kebaikan-Sesuai (Goodness-of-Fit)Exercise 9: RMSE langkah demi langkah Exercise 10: R-Squared Exercise 11: Galat Baku Exercise 12: Variasi di Sekitar Tren Exercise 13: Variasi dalam Dua Bagian

Pada bab terakhir, kita memperkenalkan konsep dari statistika inferensial, dan menggunakannya untuk mengeksplorasi bagaimana maximum likelihood estimation dan bootstrap resampling dapat digunakan untuk mengestimasi parameter model linear. Kemudian kita menerapkan metode ini untuk membuat pernyataan probabilistik tentang keyakinan kita terhadap parameter model.

Exercise 1: Konsep Statistik Inferensial Exercise 2: Statistik Sampel versus Populasi Exercise 3: Variasi dalam Statistik Sampel Exercise 4: Memvisualisasikan Variasi Suatu Statistik Exercise 5: Estimasi Model dan Likelihood Exercise 6: Estimasi Parameter Populasi Exercise 7: Memaksimalkan Likelihood, Bagian 1 Exercise 8: Memaksimalkan Likelihood, Bagian 2 Exercise 9: Ketidakpastian Model dan Distribusi Sampel Exercise 10: Bootstrap dan Standard Error Exercise 11: Mengestimasi Kecepatan dan Kepercayaan Exercise 12: Visualisasikan Bootstrap Exercise 13: Kesalahan Model dan Keacakan Exercise 14: Statistik Uji dan Ukuran Efek Exercise 15: Hipotesis Nol Exercise 16: Memvisualisasikan Statistik Uji Exercise 17: Memvisualisasikan P-Value

Latihan Saat Ini

Exercise 18: Penutup Kursus