ランダムフォレストのフルモデルを作成する

ランダムフォレストは、多数のサブツリーを特徴量のランダムな部分集合から構築するため、自然に特徴量選択を行います。特徴量の重要度を理解する一つの方法は、モデルを構築してから重要度を抽出することです。そこでこの演習では、Healthcare Job Attritionデータを使って rand_forest() による分類モデルを学習し、そこから特徴量重要度を抽出できるようにします。重要度を利用可能にするため、モデルは必ず importance = "impurity" を指定して作成してください。train と test の各データセットは用意されています。

tidyverse、tidymodels、vip パッケージは読み込まれています。