Variasi dalam Dua Bagian

Diberikan dua himpunan data jarak terhadap waktu, satu dengan kecepatan sangat kecil dan satu dengan kecepatan besar. Perhatikan bahwa keduanya mungkin memiliki standard error kemiringan yang sama, tetapi R-squared yang berbeda untuk model secara keseluruhan, bergantung pada besar kecilnya kemiringan ("ukuran efek") dibandingkan dengan standard error ("ketidakpastian").

Jika kita memplot kedua himpunan data sebagai plot sebar pada sumbu yang sama, kontrasnya jelas. Variasi akibat kemiringan berbeda dengan variasi akibat sebar acak di sekitar garis tren. Pada latihan ini, tujuan Anda adalah menghitung standard error dan R-squared untuk dua himpunan data tersebut dan membandingkannya.

Latihan ini merupakan bagian dari kursus

Pengantar Pemodelan Linear di Python

Instruksi latihan

Bangun dan fit() model ols() untuk kedua himpunan data distances1 dan distances2.
Gunakan .bse dari model yang dihasilkan model_1 dan model_2, serta kunci 'times' untuk mengekstrak nilai standard error untuk kemiringan dari tiap model.
Gunakan atribut .rsquared untuk mengekstrak nilai R-squared dari tiap model.
Cetak se_1, rsquared_1, se_2, rsquared_2, lalu bandingkan secara visual.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Build and fit two models, for columns distances1 and distances2 in df
model_1 = ols(formula="____ ~ times", data=df).____()
model_2 = ols(formula="____ ~ times", data=df).____()

# Extract R-squared for each model, and the standard error for each slope
se_1 = model_1.____['times']
se_2 = model_2.____['times']
rsquared_1 = model_1.____
rsquared_2 = model_2.____

# Print the results
print('Model 1: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))
print('Model 2: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Pengantar Pemodelan Linear di Python

SkillTag.level.intermediateSkillTag.label

4.7+

Mulai Kursus Gratis

Kita memulai kursus dengan eksplorasi awal terhadap hubungan linear, termasuk beberapa contoh pemicu tentang bagaimana model linear digunakan, serta demonstrasi metode visualisasi data dari matplotlib. Selanjutnya kita menggunakan statistik deskriptif untuk mengkuantifikasi bentuk data dan menggunakan korelasi untuk mengukur kekuatan hubungan linear antara dua variabel.

Exercise 1: Pengantar Pemodelan Data Exercise 2: Alasan Melakukan Pemodelan: Interpolasi Exercise 3: Alasan Melakukan Pemodelan: Ekstrapolasi Exercise 4: Alasan Melakukan Pemodelan: Mengestimasi Hubungan Exercise 5: Memvisualisasikan Hubungan Linear Exercise 6: Memplot Data Exercise 7: Memplot Model pada Data Exercise 8: Mengestimasi Kemiringan & Intersep Secara Visual Exercise 9: Mengkuantifikasi Hubungan Linear Exercise 10: Mean, Deviasi, & Standar Deviasi Exercise 11: Kovarians vs Korelasi Exercise 12: Kekuatan Korelasi

Di sini kita melihat komponen yang membentuk sebuah model linear. Menggunakan konsep Deret Taylor, kita berfokus pada parameter kemiringan (slope) dan intersep, bagaimana keduanya mendefinisikan model, serta cara menafsirkannya dalam berbagai konteks terapan. Kita menerapkan beragam modul Python untuk menemukan model yang paling sesuai dengan data, dengan menghitung nilai optimal dari kemiringan dan intersep menggunakan least-squares, numpy, statsmodels, dan scikit-learn.

Exercise 1: Apa yang membuat sebuah model linear Exercise 2: Suku dalam sebuah Model Exercise 3: Komponen Model Exercise 4: Parameter Model Exercise 5: Menafsirkan Kemiringan dan Intersep Exercise 6: Proporsionalitas Linear Exercise 7: Kemiringan dan Laju Perubahan Exercise 8: Intersep dan Titik Awal Exercise 9: Optimisasi Model Exercise 10: Residual Sum of the Squares Exercise 11: Meminimalkan Residual Exercise 12: Memvisualisasikan Minimum RSS Exercise 13: Optimisasi Kuadrat Terkecil Exercise 14: Kuadrat Terkecil dengan `numpy`Exercise 15: Optimisasi dengan Scipy Exercise 16: Kuadrat Terkecil dengan `statsmodels`

Berikutnya kita akan menerapkan model pada data nyata dan membuat prediksi. Kita akan mengeksplorasi beberapa jebakan umum dan keterbatasan prediksi, serta mengevaluasi dan membandingkan model dengan mengkuantifikasi dan mengontraskan sejumlah ukuran goodness-of-fit, termasuk RMSE dan R-squared.

Exercise 1: Pemodelan Data Nyata Exercise 2: Model Linear dalam Antropologi Exercise 3: Model Linear dalam Oseanografi Exercise 4: Model Linear dalam Kosmologi Exercise 5: Batas Prediksi Exercise 6: Interpolasi: Waktu di Antara Exercise 7: Ekstrapolasi: Melewati Batas Exercise 8: Kebaikan-Sesuai (Goodness-of-Fit)Exercise 9: RMSE langkah demi langkah Exercise 10: R-Squared Exercise 11: Galat Baku Exercise 12: Variasi di Sekitar Tren Exercise 13: Variasi dalam Dua Bagian

Latihan Saat Ini

Pada bab terakhir, kita memperkenalkan konsep dari statistika inferensial, dan menggunakannya untuk mengeksplorasi bagaimana maximum likelihood estimation dan bootstrap resampling dapat digunakan untuk mengestimasi parameter model linear. Kemudian kita menerapkan metode ini untuk membuat pernyataan probabilistik tentang keyakinan kita terhadap parameter model.

Exercise 1: Konsep Statistik Inferensial Exercise 2: Statistik Sampel versus Populasi Exercise 3: Variasi dalam Statistik Sampel Exercise 4: Memvisualisasikan Variasi Suatu Statistik Exercise 5: Estimasi Model dan Likelihood Exercise 6: Estimasi Parameter Populasi Exercise 7: Memaksimalkan Likelihood, Bagian 1 Exercise 8: Memaksimalkan Likelihood, Bagian 2 Exercise 9: Ketidakpastian Model dan Distribusi Sampel Exercise 10: Bootstrap dan Standard Error Exercise 11: Mengestimasi Kecepatan dan Kepercayaan Exercise 12: Visualisasikan Bootstrap Exercise 13: Kesalahan Model dan Keacakan Exercise 14: Statistik Uji dan Ukuran Efek Exercise 15: Hipotesis Nol Exercise 16: Memvisualisasikan Statistik Uji Exercise 17: Memvisualisasikan P-Value Exercise 18: Penutup Kursus