1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ一般化線形モデル

Connected

演習

予測を計算する

実務では、当てはめたロジスティック回帰を使って確率を推定し、推定値の信頼区間を作ることがよくあります。wells データセットとモデル 'switch ~ arsenic' を用いて、学習データに含まれていない新しい観測 wells_test に対し、最も近い安全な井戸に切り替える確率を予測したいとします。

これを .predict() メソッドを使って行います。

.predict() はいくつかの引数を取ることに注意してください:

  • exog - 新しい観測(テストデータセット)
  • transform = True - 当てはめに使った式 y ~ x をデータに適用します。

exog を指定しない場合、確率は学習データセットに対して計算されます。

モデル wells_fit とデータセット wells および wells_test はワークスペースに読み込まれています。

指示

100 XP
  • 当てはめ済みモデル wells_fit を使ってテストデータ wells_test 上で予測を計算し、prediction に保存します。
  • 既存のデータフレーム wells_test に prediction を追加し、列名を prediction とします。
  • print() を使って、switch、arsenic、prediction 列のある wells_test の先頭5行を表示します。先頭5行のみを見るには pandas の head() 関数を使ってください。