1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶTree-Based ModelsによるMachine Learning

Connected

演習

学習用/テスト用への分割

モデルを正しく評価するには、データを2つの異なる部分に分け、片方で学習し、もう片方でテストする必要があります。そうしないと、答えを知っている状態で試験を受けるのと同じで、不正確な評価になってしまいます。

データ分割はモデリング工程の重要なステップです。ここでは、糖尿病データを分割し、分割比率を確認していきます。

前の演習で使った diabetes データは、ワークスペースにあらかじめ読み込まれています。

指示1 / 3

undefined XP
    1
    2
    3
  • diabetes の tibble を 80% を学習用、20% をテスト用とする diabetes_split に分割します。
  • 得られたオブジェクトを表示します。