1. Lära sig
  2. /
  3. Courses
  4. /
  5. Rによる次元削減

Connected

exercise

UMAP で住宅価格を分離する

あなたは PCA と t-SNE を使って、California の住宅販売データ(house_sales_df)の次元削減を行いました。次は UMAP を使います。UMAP の最終的な出力は t-SNE と非常によく似ていますが、UMAP のほうが計算効率が高い傾向があります。また、より大域的な構造を保持しようとします。実務的には、クラスタ間の距離を類似度の尺度として解釈できるということを意味します——これは t-SNE ではできなかったことです。

house_sales_df の目的変数は price であることを思い出してください。num_comp = 2 を設定します。tidyverse と embed パッケージは読み込まれています。

Instruktioner

100 XP
  • レシピで step_umap() を使い、house_sales_df のすべての説明変数に UMAP を当てて、変換後のデータを umap_df に保存します。
  • ggplot() を使って UMAP の次元を可視化し、目的変数 price を色で表現します。