Pratik konular: ölçekleme
Videoda, PCA yapmadan önce veriyi ölçeklendirmenin PCA modelinin sonuçlarını değiştirdiğini görmüştün. Burada, ölçekleme ile ve ölçekleme olmadan PCA uygulayacak, ardından sonuçları biplot’larla görselleştireceksin.
Bazen değişkenlerin varyansları önemli ölçüde farklıysa ölçekleme uygundur. Bu durum genellikle değişkenlerin farklı ölçü birimlerine sahip olduğu (örneğin Fahrenheit derece [sıcaklık] ve mil [mesafe]) durumlarda görülür. Ölçekleme kullanma kararını vermek, temel bileşen analizini gerçekleştirirken önemli bir adımdır.
Bu egzersiz
R ile Denetimsiz Öğrenme
kursunun bir parçasıdırEgzersiz talimatları
Aynı Pokemon veri kümesi çalışma alanında pokemon olarak mevcut, ancak bir yeni değişken eklendi: Total.
- Düzenleyicinin üst kısmında, modeldeki her değişkenin ortalamasını ve standart sapmasını hesaplayan biraz kod var. Değişkenlerin ölçeklerinin orijinal veride nasıl farklılaştığını görmek için bu kodu çalıştır.
pokemoniçin ölçekleme ile bir PCA modeli oluştur ve sonucupr.with.scalingdeğişkenine ata.pokemoniçin ölçekleme olmadan bir PCA modeli oluştur ve sonucupr.without.scalingdeğişkenine ata.- Her iki modeli de (teker teker) çizdirmek ve çıktıları karşılaştırmak için
biplot()kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Mean of each variable
colMeans(pokemon)
# Standard deviation of each variable
apply(pokemon, 2, sd)
# PCA model with scaling: pr.with.scaling
# PCA model without scaling: pr.without.scaling
# Create biplots of both for comparison