1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giảm Chiều Dữ Liệu với R

Connected

Bài tập

Phân tách giá nhà bằng t-SNE

t-SNE là một kỹ thuật giảm chiều phi tuyến. Nó nhúng dữ liệu có số chiều cao vào một không gian có số chiều thấp hơn. Trong quá trình đó, nó cố gắng giữ các điểm ở gần những hàng xóm ban đầu của chúng. Bạn sẽ tạo một biểu đồ t-SNE để so sánh với biểu đồ PCA ở bài trước. PCA giữ được cấu trúc tổng thể (toàn cục) của dữ liệu, nhưng không giữ cấu trúc cục bộ. t-SNE giữ cấu trúc cục bộ bằng cách giữ cho các điểm láng giềng trong không gian nhiều chiều vẫn gần nhau khi chuyển sang không gian ít chiều hơn. Bạn sẽ thấy điều này trên các biểu đồ.

Bạn sẽ áp dụng t-SNE để giảm chiều dữ liệu house_sales_df. Biến đích của house_sales_df là price. Các gói tidyverse và Rtsne đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Huấn luyện t-SNE cho house_sales_df bằng Rtsne().
  • Gắn (bind) các tọa độ X và Y của t-SNE vào house_sales_df.
  • Vẽ kết quả t-SNE bằng ggplot(), mã hóa biến đích bằng màu sắc.