1. 학습
  2. /
  3. 강의
  4. /
  5. Rで学ぶSupervised Learning:分類

Connected

연습 문제

単純なロジスティック回帰モデルを作る

donors データセットには、麻痺した在郷軍人向けの募金依頼を郵送した93,462人分のデータが含まれています。donated 列は、郵送に応じて寄付をした場合は 1、それ以外は 0 です。この二値の結果がロジスティック回帰モデルの「従属変数」になります。

残りの列は、寄付行動に影響しうる見込み寄付者の特徴量です。これらがモデルの「独立変数」です。

回帰モデルを作成するときは、どの独立変数が従属変数の予測に役立つかについて仮説を立てると有用です。無効な郵送先住所に 1、それ以外に 0 が入る bad_address 列は、寄付の確率を下げるかもしれません。同様に、宗教への関心(interest_religion)や退役軍人問題への関心(interest_veterans)は、より多くの慈善寄付と関連していそうです。

この演習では、これら3つの要因を使って寄付行動の単純なモデルを作成します。データセット donors は利用可能です。

지침

100 XP
  • str() 関数で donors を確認します。
  • table() 関数で donated 変数の各水準の出現回数を数えます。
  • 先に説明した3つの独立変数を使い、フォーミュラインターフェースでロジスティック回帰モデルを当てはめます。
    • 最初の引数にフォーミュラを、data 引数にデータフレームを指定して glm() を呼び出します。
    • 結果を donation_model として保存します。
  • summary() でモデルオブジェクトを要約します。