1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による Supervised Learning:回帰

Connected

演習

失業モデルからの予測

この演習では、失業モデル unemployment_model を使って unemployment データから予測を行い、学習データである unemployment における女性失業率の予測値と実測値を比較します。さらに、newrates の新しいデータ(男性失業率が 5% の 1 観測のみ)に対しても予測します。

lm モデル向けの predict()(docs)インターフェースは次の形式です。

predict(model, newdata)

プロットには ggplot2 パッケージを使うので、予測列を unemployment データフレームに追加します。アウトカムと予測をプロットし、完全予測(アウトカムが予測値と等しい場合)を表す直線と比較します。

dframe$outcome と dframe$pred の散布図(x 軸に pred、y 軸に outcome)を描き、さらに outcome == pred を示す青い直線を加える ggplot2 のコマンドは次のとおりです。

ggplot(dframe, aes(x = pred, y = outcome)) + 
       geom_point() +  
       geom_abline(color = "blue")

unemployment、unemployment_model、newrates はあらかじめ読み込まれています。

指示

100 XP
  • predict() を使って unemployment データから女性失業率を予測し、新しい列 prediction に代入します。
  • library() コマンドで ggplot2 パッケージを読み込みます。
  • ggplot() で予測値と実際の失業率を比較します。予測値を x 軸に置きます。結果は完全予測の直線にどれくらい近いでしょうか?
  • データフレーム newrates を使って、男性失業率が 5% のときに期待される女性失業率を予測します。変数 pred に代入して、出力してください。