1. Learn
  2. /
  3. Courses
  4. /
  5. R による Supervised Learning:回帰

Connected

Exercise

スズメの生存確率を予測しよう

この演習では、前の演習で作成したスズメの生存モデルを使って、生存確率を予測します。

glm() モデルから予測確率を得るために predict()(docs)を呼び出す際は、応答(確率)が欲しいことを明示する必要がある点を思い出してください。

predict(model, type = "response")

これを指定しない場合、ロジスティック回帰モデルでの predict() は確率ではなく、事象の対数オッズを返します。

また、モデルの予測からゲインカーブを描くために GainCurvePlot()(docs)関数も使用します。モデルのゲインカーブが理想的な("wizard")ゲインカーブに近いほど、モデルはスズメをうまく並べ替えられています。つまり、実際に生存したスズメに対してより高い生存確率を予測できているということです。GainCurvePlot() 関数の入力は次のとおりです:

  • frame: 予測列と正解列を含むデータフレーム
  • xvar: 予測値の列名(文字列)
  • truthVar: 実際の結果の列名(文字列)
  • title: プロットのタイトル(文字列)

GainCurvePlot(frame, xvar, truthVar, title)

sparrow データフレームとモデル sparrow_model はすでに読み込まれています。

Instructions

100 XP
  • sparrow に学習データでの予測値を格納する新しい列 pred を作成します。
  • GainCurvePlot() を呼び出して予測のゲインカーブを作成します。モデルは、実際に生存したかどうかでスズメをうまく並べ替えられていますか?