Membandingkan nilai prediksi
Pada latihan sebelumnya, Anda telah memasangkan model regresi linear dan GLM (logistik) menggunakan data crab, memprediksi y dengan width. Dengan kata lain, Anda ingin memprediksi probabilitas bahwa seekor betina memiliki kepiting satelit di dekatnya berdasarkan lebar tubuhnya.
Pada latihan ini, Anda akan menelaah lebih lanjut probabilitas taksiran (keluaran) dari kedua model dan mencoba menyimpulkan apakah pemodelan linear cocok untuk permasalahan ini.
Praktik umum adalah menguji model pada data baru yang belum pernah dilihat. Himpunan data seperti ini disebut sampel test.
Sampel test telah dibuat untuk Anda dan dimuat ke dalam workspace. Perhatikan bahwa Anda memerlukan nilai uji untuk semua variabel yang ada dalam model, yang pada contoh ini adalah width.
Himpunan data crab telah dimuat sebelumnya ke dalam workspace.
Latihan ini adalah bagian dari kursus
Generalized Linear Models di Python
Petunjuk latihan
- Gunakan
print()untuk melihat himpunantest. - Dengan menggunakan sampel
test, hitung probabilitas taksiran menggunakan.predict()pada model linear terpasangmodel_LMdan simpan sebagaipred_lm. Hitung juga probabilitas taksiran menggunakan.predict()pada model GLM (logistik) terpasang yang disimpan sebagaimodel_GLMdan simpan sebagaipred_glm. - Gunakan
pandasDataFrame()untuk menggabungkan prediksi dari kedua model dan simpan sebagaipredictions. - Konkatenasikan
testdanpredictionslalu simpan sebagaiall_data. Lihatall_datamenggunakanprint().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# View test set
print(____)
# Compute estimated probabilities for linear model: pred_lm
____ = model_LM.____(____)
# Compute estimated probabilities for GLM model: pred_glm
____ = model_GLM.____(____)
# Create dataframe of predictions for linear and GLM model: predictions
____ = pd.DataFrame({'Pred_LM': ____, 'Pred_GLM': ____})
# Concatenate test sample and predictions and view the results
all_data = pd.concat([____, ____], axis = 1)
print(____)