1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ一般化線形モデル

Connected

演習

予測値を比較する

前の演習では、crab データを使って width から y を予測する線形回帰モデルと GLM(ロジスティック)回帰モデルの両方を当てはめました。つまり、雌の幅が与えられたときに、近くにサテライトのオスガニがいる確率を予測したい、という設定でした。

この演習では、2つのモデルから得られた推定確率(出力)を詳しく確認し、今回の問題に線形モデルの当てはまりが適切かどうかを考察します。

一般的には、モデルは新しい(まだ見ていない)データでテストします。このようなデータセットは test サンプルと呼ばれます。
test サンプルはすでに作成され、ワークスペースに読み込まれています。モデルに含まれるすべての変数についてテスト値が必要になる点に注意してください。この例では width です。

crab データセットはワークスペースに読み込まれ済みです。

指示

100 XP
  • print() を使って test セットを表示します。
  • test サンプルを使い、当てはめ済みの線形モデル model_LM に対して .predict() を実行して推定確率を計算し、pred_lm に保存します。同様に、当てはめ済みの GLM(ロジスティック)モデル model_GLM に対して .predict() を実行して推定確率を計算し、pred_glm に保存します。
  • pandas の DataFrame() を使って、両モデルの予測を結合し、predictions に保存します。
  • test と predictions を連結して all_data に保存し、print() で all_data を表示します。