1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rによる次元削減

Connected

演習

相互情報を持つ特徴量

credit_df データフレームには、いくつかの連続的な特徴量が含まれています。2つの連続変数が相関している場合、それらは同じ情報を持っています。これを 相互情報(mutual information) と呼びます。強く相関した特徴量は、単に重複しているだけではありません。モデリングで問題を引き起こすことがあります。たとえば回帰では、高い相関(すなわち多重共線性)があると、意味のない結果を招くことがあります。相互情報の感覚をつかむために、相互情報を持つ特徴量を特定できるよう、相関プロットを作成しましょう。

tidyverse と corrr パッケージは読み込まれています。

指示

100 XP
  • credit_df の数値特徴量について、correlate() と rplot() を使って相関プロットを作成します。