1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rによる次元削減

Connected

演習

PCA で住宅価格を分離する

PCA と t-SNE はどちらも特徴抽出の手法ですが、PCA はデータの線形構造しか捉えられません。 この演習では、house_sales_df 全体の PCA プロットを作成し、t-SNE の出力と比較できるようにします。

house_sales_df における目的変数は price です。PCA を当てる前に、必ずこれを除外することが重要です。

tidyverse と ggfortify パッケージは読み込まれています。

指示

100 XP
  • house_sales_df の説明変数に PCA を適合させます。
  • autoplot() を使って最初の 2 つの主成分をプロットし、色で price を表現します。