Açıklanan varyans
Bu egzersizde, temel bileşen sayısı arttıkça açıklanan varyans oranını gösteren scree grafikleri üreteceksin. R'da bu grafikleri doğrudan PCA modelinden oluşturan yerleşik bir fonksiyon olmadığından, PCA çıktısını bu grafikler için hazırlaman gerekiyor.
Bu grafikleri incelerken, açıklanan varyans miktarında sana doğal bir temel bileşen sayısı seçtirebilecek bir dirsek (elbow) olup olmadığını sorgula. Gerçek dünya veri kümelerinde sıkça olduğu gibi belirgin bir dirsek yoksa, scree grafiğine bakarak kaç temel bileşeni tutacağına başka nasıl karar verebileceğini düşün.
Bu egzersiz
R ile Denetimsiz Öğrenme
kursunun bir parçasıdırEgzersiz talimatları
Daha önce oluşturduğun wisc.data, diagnosis ve wisc.pr değişkenleri hâlâ kullanılabilir.
wisc.prnesnesininsdevbileşenini kareye alarak her bir temel bileşenin varyansını hesapla. Sonucupr.varadlı bir nesne olarak kaydet.- Tüm temel bileşenlerin toplam açıklanan varyansına bölerek her bir temel bileşenin açıkladığı varyansı hesapla. Bunu
pveadlı bir değişkene ata. - Her temel bileşen için açıklanan varyansı gösteren bir grafik oluştur.
cumsum()fonksiyonunu kullanarak kümülatif açıklanan varyans oranını gösteren bir grafik oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Set up 1 x 2 plotting grid
par(mfrow = c(1, 2))
# Calculate variability of each component
# Variance explained by each principal component: pve
# Plot variance explained for each principal component
plot(___, xlab = "Principal Component",
ylab = "Proportion of Variance Explained",
ylim = c(0, 1), type = "b")
# Plot cumulative proportion of variance explained
plot(___, xlab = "Principal Component",
ylab = "Cumulative Proportion of Variance Explained",
ylim = c(0, 1), type = "b")