1. 学ぶ
  2. /
  3. コース
  4. /
  5. R での tidymodels によるモデリング

Connected

演習

recipes で相関の高い予測変数を除去する

学習用データとテストデータから相関の高い予測変数を取り除くことは、モデル学習をスムーズに進めるための重要な特徴量エンジニアリングのステップです。

monthly_charges と avg_data_gb が高い相関を持つことが分かったので、通信データの特徴量エンジニアリングパイプラインに step_corr() を使った相関フィルターを追加する必要があります。

この演習では、通信データから相関の高い予測変数を除去する recipe オブジェクトを作成します。

telecom_training と telecom_test データセットはすでにセッションに読み込まれています。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • recipe オブジェクト telecom_cor_rec を作成し、目的変数を canceled_service、telecom_training の残りのすべての列を予測変数に設定します。
  • all_numeric() セレクタ関数と相関しきい値 0.8 を使って、高い相関を持つ予測変数を除去する前処理ステップを追加します。