1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ中級回帰分析

Connected

演習

多変数の可視化

変数が増えると、すべてを同時にプロットするのは一気に難しくなります。2つの数値変数には x 軸と y 軸を使い、3つ目の数値変数には色を使えます。さらにカテゴリ変数にはファセットが使えます。ただし、そのあたりが限界で、これ以上増やすとプロットの解釈が難しくなります。相関ヒートマップやパラレルコーディネーツなど、より多くの変数を扱える専門的な可視化もありますが、各変数について得られる情報は少なくなり、モデル予測の可視化にもあまり向いていません。

ここでは散布図の限界に挑戦し、住宅価格、MRT 駅までの距離、近隣のコンビニ数、住宅の築年数を、1つのプロットにまとめて表示します。

taiwan_real_estate は利用可能で、ggplot2 は読み込まれています。

指示

100 XP
  • taiwan_real_estate データセットを使い、n_convenience を縦軸、dist_to_mrt_m の平方根を横軸にした散布図を作成し、price_twd_msq を色で表現します。
  • 連続値用の viridis の plasma カラースケールを使います。
  • house_age_years でラップするファセットを適用します。