Variasi dalam Dua Bagian
Diberikan dua himpunan data jarak terhadap waktu, satu dengan kecepatan sangat kecil dan satu dengan kecepatan besar. Perhatikan bahwa keduanya mungkin memiliki standard error kemiringan yang sama, tetapi R-squared yang berbeda untuk model secara keseluruhan, bergantung pada besar kecilnya kemiringan ("ukuran efek") dibandingkan dengan standard error ("ketidakpastian").
Jika kita memplot kedua himpunan data sebagai plot sebar pada sumbu yang sama, kontrasnya jelas. Variasi akibat kemiringan berbeda dengan variasi akibat sebar acak di sekitar garis tren. Pada latihan ini, tujuan Anda adalah menghitung standard error dan R-squared untuk dua himpunan data tersebut dan membandingkannya.

Latihan ini adalah bagian dari kursus
Pengantar Pemodelan Linear di Python
Petunjuk latihan
- Bangun dan
fit()modelols()untuk kedua himpunan datadistances1dandistances2. - Gunakan
.bsedari model yang dihasilkanmodel_1danmodel_2, serta kunci'times'untuk mengekstrak nilai standard error untuk kemiringan dari tiap model. - Gunakan atribut
.rsquareduntuk mengekstrak nilai R-squared dari tiap model. - Cetak
se_1,rsquared_1,se_2,rsquared_2, lalu bandingkan secara visual.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build and fit two models, for columns distances1 and distances2 in df
model_1 = ols(formula="____ ~ times", data=df).____()
model_2 = ols(formula="____ ~ times", data=df).____()
# Extract R-squared for each model, and the standard error for each slope
se_1 = model_1.____['times']
se_2 = model_2.____['times']
rsquared_1 = model_1.____
rsquared_2 = model_2.____
# Print the results
print('Model 1: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))
print('Model 2: SE = {:0.3f}, R-squared = {:0.3f}'.format(____, ____))