1. 학습
  2. /
  3. 강의
  4. /
  5. Rで学ぶ中級回帰分析

Connected

연습 문제

ロジスティック回帰アルゴリズム

ロジスティック回帰の内部に踏み込み、アルゴリズムを実装してみましょう。R の glm() 関数はとても複雑なので、ここでは単一のデータセットに対する単純なロジスティック回帰の実装に絞ります。

評価指標としては二乗和ではなく尤度を使います。ただし、計算の安定性を考えると対数尤度を使う方が良いので、こちらを用います。さらにもう一点、対数尤度は最大化したい一方で、optim() は既定で最小値を探索するため、計算しやすいように「負の」対数尤度を用います。

各観測の対数尤度の値は次のとおりです。

Formula for log-likelihood

計算すべき指標は、これらの対数尤度の寄与分の総和にマイナスを付けたものです。

説明変数の値(churn の time_since_last_purchase 列)は x_actual として利用できます。 目的変数の値(churn の has_churned 列)は y_actual として利用できます。

지침 1/3

undefined XP
    1
    2
    3
  • 切片を 1 に設定します。
  • 傾きを 0.5 に設定します。
  • 予測 y 値を、切片に傾きと実際の x 値の積を足したものに、ロジスティック分布の CDF を適用して計算します。
  • 各項の対数尤度を、予測 y 値の対数に実際の y 値を掛けたものと、1 から予測 y 値を引いたものの対数に 1 から実際の y 値を引いたものを掛けたものの和として計算します。
  • 各項の対数尤度の総和にマイナスを付けて計算します。