1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶTree-Based ModelsによるMachine Learning

Connected

演習

予測を作成する

データで予測を行うことは、Machine Learning の基本的な目的のひとつです。 データの分割とモデルの学習方法を身につけたので、次は学習したモデルを使って未知のサンプルに対して予測してみましょう。

ここでは、学習データを用いて木の仕様に適合させたモデルで、テストセットに対する予測を行います。

ワークスペースには、前のステップで作成したデータセット(diabetes_train と diabetes_test)と、次のコードで作成した決定木の仕様 tree_spec が用意されています。

tree_spec <- decision_tree() %>%
  set_engine("rpart") %>%
  set_mode("classification") 

指示

100 XP
  • 目的変数を outcome、説明変数はすべて使用して、トレーニングデータに仕様を適合させて model を作成します。
  • 作成したモデルを使って、テストセット内の各観測について糖尿病の outcome を予測し、結果を predictions に代入します。
  • テストセットの正解 outcome を true_class という列名で predictions に追加し、predictions_combined として保存します。
  • head() 関数を使って、結果の先頭行を表示します。