1. Uczyć się
  2. /
  3. Courses
  4. /
  5. R で学ぶネットワークデータの予測分析

Connected

Exercise

相関のある変数

この演習では、相関のある変数に着目してデータセットを確認します。 とくにロジスティック回帰などの二値分類器を適用する前に、相関の高い変数を取り除くことが重要です。 2つ以上の変数が高い相関を持つ場合は、1つを残して他は削除します。

まず、corrplot パッケージの corrplot() 関数を使って相関を可視化します。 相関プロットでは、青が正の相関、赤が負の相関を表します。 色が濃いほど相関が強いことを示します。 最後に、相関の高い変数をデータセットから削除します。

Instrukcje 1 / 2

undefined XP
    1
    2
  • corrplot パッケージを読み込みます。
  • 関数 cor() を使って相関行列 M を作成します。データセットの一部を引数に渡します。
  • corrplot() に M を与えて、変数間の相関を可視化します。