1. 学ぶ
  2. /
  3. コース
  4. /
  5. R での tidymodels によるモデリング

Connected

演習

相関のある予測変数を見つける

相関の高い予測変数は重複した情報を含み、モデルの学習に悪影響を与えることがあります。2つの変数が強く相関していると、それらの値は互いに線形に変化し、Machine Learning アルゴリズムに同じ情報を提供してしまいます。この現象は多重共線性と呼ばれます。

モデルの学習を始める前に、データセットを探索してこれらの関係を見つけ、特徴量エンジニアリングの段階で取り除くことが重要です。

この演習では、telecom_training データセットの数値予測変数すべてについて相関行列を作成して探索します。

telecom_training データはすでにセッションに読み込まれています。

指示1 / 3

undefined XP
    1
    2
    3
  • telecom_training データから、数値の列をすべて選択します。
  • telecom_training の数値列の相関行列を作成します。