1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶTree-Based ModelsによるMachine Learning

Connected

演習

From zero to hero

モデル仕様を作成し、データを学習用とテスト用に分割するスキルを身につけました。 分割時のクラス不均衡を避ける方法も理解しています。 それでは、前のレッスンで学んだことを組み合わせ、学習データだけを使ってモデルを構築していきましょう!

ここでは本格的な「machine learning パイプライン」を作ります。 モデル仕様の作成、データの学習用・テスト用への分割、そして最後に学習データへのモデル当てはめ、という流れで進めます。楽しんでください!

指示

100 XP
  • diabetes_split を作成します。学習用データが diabetes の全行のうち 3/4 を含み、かつ学習用・テスト用の双方で outcome 変数の分布が似るように分割してください。
  • rpart エンジンを使って決定木のモデル仕様を作成し、tree_spec として保存します。
  • diabetes_split の学習データを使い、目的変数を outcome、説明変数を bmi と skin_thickness としてモデルを当てはめ、model_trained を作成します。