二値予測をしてみよう

前の演習では、glm() 関数を使って寄付者の行動に対するロジスティック回帰モデルを作成しました。R の多くの Machine Learning 手法と同様に、将来の行動を予測するために、作成したモデルオブジェクトに predict() 関数を適用できます。デフォルトでは、predict() は type = "response" を指定しない限り、予測を「対数オッズ」で出力します。これを指定することで、対数オッズが「確率」に変換されます。

ロジスティック回帰モデルは結果の「確率」を推定するため、どの閾値で行動に移すかは皆さんが決める必要があります。慎重すぎることと攻めすぎることのバランスが重要です。たとえば、寄付確率が99%以上の人だけに依頼すると、推定確率は低くても実際には寄付してくれる多くの人を逃してしまうかもしれません。特に本データのように寄付が比較的まれな、強く不均衡な結果では、このバランスはとても重要です。

データセット donors とモデル donation_model は用意されています。