1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶTree-Based ModelsによるMachine Learning

Connected

演習

モデルを学習しよう

モデル仕様は、画家にとってのキャンバスのようなものです。ですが、キャンバスに色が必要なように、仕様にはデータが必要です。予測ができるのは、最終的に学習されたモデルだけです。

「モデル仕様 + データ = モデル」

この演習では、健康に関する変数を予測子として用い、糖尿病リスクをモデル化する決定木を学習します。応答変数 outcome は患者が糖尿病かどうかを示し、これは2つのクラスのみを持つ二値分類問題です。データセットには blood_pressure、age、bmi など、患者の健康に関する変数も含まれています。

この先のコースでは、 tidymodels パッケージは常に事前に読み込まれています。 この演習では、diabetes データセットもワークスペースで利用できます。

指示

100 XP
  • rpart エンジンを使う決定木の仕様 tree_spec を作成します。
  • 仕様に diabetes データセットを当てはめ、outcome が予測子 bmi のみで決まるモデル tree_model_bmi を学習します。
  • コンソールにモデルを出力します。