BaşlayınÜcretsiz Başlayın

UMAP ile konut fiyatlarını ayırma

California konut satış verilerinin (house_sales_df) boyut sayısını PCA ve t-SNE kullanarak azalttın. Şimdi UMAP kullanacaksın. UMAP'in nihai çıktısı t-SNE'ye oldukça benzer, ancak UMAP genellikle hesaplama açısından daha verimlidir. Ayrıca daha fazla küresel yapıyı korumaya çalışır. Pratikte bu, kümeler arasındaki mesafeyi benzerliğin bir ölçüsü olarak yorumlayabileceğin anlamına gelir — t-SNE ile yapamadığın bir şey.

Unutma, house_sales_df için hedef değişken price. num_comp = 2 olarak ayarla. tidyverse ve embed paketleri senin için yüklendi.

Bu egzersiz

R'de Boyutsal Azaltma

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Bir tarifte step_umap() kullanarak house_sales_df içindeki tüm yordayıcılara UMAP uygula ve dönüştürülmüş veriyi umap_df içinde sakla.
  • Hedef değişken priceı renkte kodlayarak UMAP boyutlarını ggplot() ile görselleştir.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Fit UMAP
set.seed(1234)
umap_df <- ___(___ ~ ., data = ___) %>% 
  ___(___()) %>% 
  ___(___(), num_comp = 2) %>% 
  prep() %>% 
  ___() 

# Plot UMAP
___ %>%  
  ___(aes(x = ___, y = ___, color = ___)) +
  ___(alpha = 0.7) +
  scale_color_gradient(low="gray", high="blue")
Kodu Düzenle ve Çalıştır