MulaiMulai sekarang secara gratis

Variasi dalam Dua Bagian

Diberikan dua himpunan data jarak terhadap waktu, satu dengan kecepatan sangat kecil dan satu dengan kecepatan besar. Perhatikan bahwa keduanya mungkin memiliki standard error kemiringan yang sama, tetapi R-squared yang berbeda untuk model secara keseluruhan, bergantung pada besar kecilnya kemiringan ("ukuran efek") dibandingkan dengan standard error ("ketidakpastian").

Jika kita memplot kedua himpunan data sebagai plot sebar pada sumbu yang sama, kontrasnya jelas. Variasi akibat kemiringan berbeda dengan variasi akibat sebar acak di sekitar garis tren. Pada latihan ini, tujuan Anda adalah menghitung standard error dan R-squared untuk dua himpunan data tersebut dan membandingkannya.

Latihan ini adalah bagian dari kursus

Pengantar Pemodelan Linear di Python

Lihat Kursus

Petunjuk latihan

  • Bangun dan fit() model ols() untuk kedua himpunan data distances1 dan distances2.
  • Gunakan .bse dari model yang dihasilkan model_1 dan model_2, serta kunci 'times' untuk mengekstrak nilai standard error untuk kemiringan dari tiap model.
  • Gunakan atribut .rsquared untuk mengekstrak nilai R-squared dari tiap model.
  • Cetak se_1, rsquared_1, se_2, rsquared_2, lalu bandingkan secara visual.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Build and fit two models, for columns distances1 and distances2 in df
model_1 = ols(formula="____ ~ times", data=df).____()
model_2 = ols(formula="____ ~ times", data=df).____()

# Extract R-squared for each model, and the standard error for each slope
se_1 = model_1.____['times']
se_2 = model_2.____['times']
rsquared_1 = model_1.____
rsquared_2 = model_2.____

# Print the results
print('Model 1: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))
print('Model 2: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))
Edit dan Jalankan Kode