1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶマーケティングアナリティクスのための機械学習

Connected

演習

主成分を用いた線形回帰

オブジェクト newsData には新しい変数 logShares が追加されています。シェア数は記事がどれだけ共有されたかを表しますが、生の分布は大きく歪んでいるため、ここではシェア数の対数を使って作業します。学んだ内容を適用して、対数シェア数を予測してみましょう。

指示

100 XP
  • すべての他の変数を用いて対数シェア数を予測するモデルを作成し、mod1 として保存します。
  • 対数シェア数と、第1〜第6主成分の値を含む新しいデータフレーム dataNewsComponents を作成します。オブジェクト pcaNews には PCA の結果が入っています。
  • 6つの主成分だけで対数シェア数を予測する2つ目のモデル(mod2)を作成します。
  • 調整済み決定係数(adjusted R squared)を比較しましょう。主成分のみを使うと値はどう変化しましたか?モデルの良さはどう評価できますか?