1. 학습
  2. /
  3. 강의
  4. /
  5. R에서의 차원 축소

Connected

연습 문제

UMAP으로 주택 가격 구분하기

PCA와 t-SNE를 사용해 캘리포니아 주택 판매 데이터(house_sales_df)의 차원을 축소해 보셨습니다. 이제 UMAP을 사용해 보겠습니다. UMAP의 최종 결과는 t-SNE와 매우 비슷하지만, 일반적으로 계산 효율이 더 좋습니다. 또한 더 많은 전역 구조를 보존하려고 합니다. 실무적으로는 군집 간 거리로 유사성을 해석할 수 있다는 뜻이며, 이는 t-SNE로는 어려웠던 부분입니다.

house_sales_df의 타깃 변수는 price입니다. num_comp = 2로 설정하세요. tidyverse와 embed 패키지는 미리 로드되어 있습니다.

지침

100 XP
  • 레시피에서 step_umap()을 사용해 house_sales_df의 모든 예측 변수에 UMAP을 적합하고, 변환된 데이터를 umap_df에 저장하세요.
  • ggplot()으로 UMAP 차원을 시각화하고, 타깃 변수 price를 색상에 인코딩하세요.