1. 学ぶ
  2. /
  3. コース
  4. /
  5. R で学ぶ統計面接対策

Connected

演習

検証用データによる評価(Validation set approach)

線形回帰の章では、猫の体重から心臓の重さを説明する線形回帰モデルを学習しました。 いま、面接官からはそのモデルの良さを評価してくださいと求められています。

この問いに答えるには、実測値と比較できる予測値を作る必要があります。 検証用データを使う方法(validation set approach)では、データを2つの部分に分割します。

まず、たとえば全行番号のうちの80%をサンプルとして無作為に取り出します。選ばれた行番号で学習用データを作成し、残りをテスト用データとして使います。

次を思い出してください。

rows <- c(1, 3)
df[-rows, ]

は、1行目と3行目以外のすべての行を抽出します。

cats データセットは作業環境に読み込まれています。

指示1 / 3

undefined XP
    1
    2
    3
  • cats データセットの行番号から、80%(四捨五入)を無作為に選びます。