BaşlayınÜcretsiz başlayın

Pratik konular: ölçekleme

Videoda, PCA yapmadan önce veriyi ölçeklendirmenin PCA modelinin sonuçlarını değiştirdiğini görmüştün. Burada, ölçekleme ile ve ölçekleme olmadan PCA uygulayacak, ardından sonuçları biplot’larla görselleştireceksin.

Bazen değişkenlerin varyansları önemli ölçüde farklıysa ölçekleme uygundur. Bu durum genellikle değişkenlerin farklı ölçü birimlerine sahip olduğu (örneğin Fahrenheit derece [sıcaklık] ve mil [mesafe]) durumlarda görülür. Ölçekleme kullanma kararını vermek, temel bileşen analizini gerçekleştirirken önemli bir adımdır.

Bu egzersiz, kursun bir parçasıdır

R ile Denetimsiz Öğrenme

Kursa Göz Atın

Egzersiz talimatları

Aynı Pokemon veri kümesi çalışma alanında pokemon olarak mevcut, ancak bir yeni değişken eklendi: Total.

  • Düzenleyicinin üst kısmında, modeldeki her değişkenin ortalamasını ve standart sapmasını hesaplayan biraz kod var. Değişkenlerin ölçeklerinin orijinal veride nasıl farklılaştığını görmek için bu kodu çalıştır.
  • pokemon için ölçekleme ile bir PCA modeli oluştur ve sonucu pr.with.scaling değişkenine ata.
  • pokemon için ölçekleme olmadan bir PCA modeli oluştur ve sonucu pr.without.scaling değişkenine ata.
  • Her iki modeli de (teker teker) çizdirmek ve çıktıları karşılaştırmak için biplot() kullan.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Mean of each variable
colMeans(pokemon)

# Standard deviation of each variable
apply(pokemon, 2, sd)

# PCA model with scaling: pr.with.scaling


# PCA model without scaling: pr.without.scaling


# Create biplots of both for comparison

Kodu Düzenle ve Çalıştır