MulaiMulai sekarang secara gratis

Membandingkan nilai prediksi

Pada latihan sebelumnya, Anda telah memasangkan model regresi linear dan GLM (logistik) menggunakan data crab, memprediksi y dengan width. Dengan kata lain, Anda ingin memprediksi probabilitas bahwa seekor betina memiliki kepiting satelit di dekatnya berdasarkan lebar tubuhnya.

Pada latihan ini, Anda akan menelaah lebih lanjut probabilitas taksiran (keluaran) dari kedua model dan mencoba menyimpulkan apakah pemodelan linear cocok untuk permasalahan ini.

Praktik umum adalah menguji model pada data baru yang belum pernah dilihat. Himpunan data seperti ini disebut sampel test. Sampel test telah dibuat untuk Anda dan dimuat ke dalam workspace. Perhatikan bahwa Anda memerlukan nilai uji untuk semua variabel yang ada dalam model, yang pada contoh ini adalah width.

Himpunan data crab telah dimuat sebelumnya ke dalam workspace.

Latihan ini adalah bagian dari kursus

Generalized Linear Models di Python

Lihat Kursus

Petunjuk latihan

  • Gunakan print() untuk melihat himpunan test.
  • Dengan menggunakan sampel test, hitung probabilitas taksiran menggunakan .predict() pada model linear terpasang model_LM dan simpan sebagai pred_lm. Hitung juga probabilitas taksiran menggunakan .predict() pada model GLM (logistik) terpasang yang disimpan sebagai model_GLM dan simpan sebagai pred_glm.
  • Gunakan pandas DataFrame() untuk menggabungkan prediksi dari kedua model dan simpan sebagai predictions.
  • Konkatenasikan test dan predictions lalu simpan sebagai all_data. Lihat all_data menggunakan print().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# View test set
print(____)

# Compute estimated probabilities for linear model: pred_lm
____ = model_LM.____(____)

# Compute estimated probabilities for GLM model: pred_glm
____ = model_GLM.____(____)

# Create dataframe of predictions for linear and GLM model: predictions
____ = pd.DataFrame({'Pred_LM': ____, 'Pred_GLM': ____})

# Concatenate test sample and predictions and view the results
all_data = pd.concat([____, ____], axis = 1)
print(____)
Edit dan Jalankan Kode