1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶ caret を使った Machine Learning

Connected

Exercise

80/20 の分割を試す

データセットをランダムに並べ替えたので、先頭の80%を学習用データ、最後の20%をテスト用データに分割できます。データのおよそ80%地点を分割点として選びます。

split <- round(nrow(mydata) * 0.80)

この分割点を使って、データセットの最初の80%を学習用データとして取り出します。

mydata[1:split, ]

同じ分割点を使って、テスト用データを決めます。

mydata[(split + 1):nrow(mydata), ]

Instructions

100 XP
  • diamonds データセットのおよそ80%地点となる行インデックスで分割点を選びます。このインデックスを split と呼びます。
  • そのインデックスを使って、train という学習用データを作成します。
  • 同じインデックスを使って、test というテスト用データを作成します。