UMAP ile konut fiyatlarını ayırma
California konut satış verilerinin (house_sales_df) boyut sayısını PCA ve t-SNE kullanarak azalttın. Şimdi UMAP kullanacaksın. UMAP'in nihai çıktısı t-SNE'ye oldukça benzer, ancak UMAP genellikle hesaplama açısından daha verimlidir. Ayrıca daha fazla küresel yapıyı korumaya çalışır. Pratikte bu, kümeler arasındaki mesafeyi benzerliğin bir ölçüsü olarak yorumlayabileceğin anlamına gelir — t-SNE ile yapamadığın bir şey.
Unutma, house_sales_df için hedef değişken price. num_comp = 2 olarak ayarla. tidyverse ve embed paketleri senin için yüklendi.
Bu egzersiz
R'de Boyutsal Azaltma
kursunun bir parçasıdırEgzersiz talimatları
- Bir tarifte
step_umap()kullanarakhouse_sales_dfiçindeki tüm yordayıcılara UMAP uygula ve dönüştürülmüş veriyiumap_dfiçinde sakla. - Hedef değişken
priceı renkte kodlayarak UMAP boyutlarınıggplot()ile görselleştir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Fit UMAP
set.seed(1234)
umap_df <- ___(___ ~ ., data = ___) %>%
___(___()) %>%
___(___(), num_comp = 2) %>%
prep() %>%
___()
# Plot UMAP
___ %>%
___(aes(x = ___, y = ___, color = ___)) +
___(alpha = 0.7) +
scale_color_gradient(low="gray", high="blue")