1. 学ぶ
  2. /
  3. コース
  4. /
  5. R で学ぶクレジットリスク・モデリング

Connected

演習

ロジスティック回帰モデルにおける複数変数

単一のパラメータの解釈は、モデルに複数の変数を含めても有効です。複数の変数を含め、特定の変数が変化したときの解釈を求める場合、他の変数は一定、つまり変化しないと仮定します。これにはラテン語で ceteris paribus(直訳すると「その他すべてを同じに保つ」)という表現があります。

複数の変数でロジスティック回帰モデルを構築するには、+ 記号で変数を追加します。式は次のようになります。

y ~ x1 + ... + xk

モデルを評価する際には、いくつか注意すべき点があります。すでにパラメータ値は確認しましたが、それだけが重要ではありません。特定のパラメータ推定値の統計的有意性も重要です。パラメータの有意性は一般に p値 と呼ばれますが、モデル出力では Pr(>|t|) と表記されます。glm では、弱い有意性は "."、非常に強い有意性は "***" で示されます。パラメータが有意でない場合、そのパラメータが0と有意に異なるとは言えないことを意味します。統計的有意性は重要であり、一般的に、デフォルトへの影響を解釈するのは有意なパラメータに限るのが妥当です。

指示

100 XP
  • glm() 関数と training_set を使ってロジスティック回帰モデルを作成します。age、ir_cat、grade、loan_amnt、annual_inc を含めてください。モデル名は log_model_multi とします。
  • 作成したモデルに summary() を組み合わせて有意性レベルを確認します。有意性レベルの意味については、次の演習でさらに詳しく見ていきます!