PCA uygulama
Analizindeki bir sonraki adım, wisc.data üzerinde PCA gerçekleştirmek.
Önceki bölümde, PCA yapmadan önce verilerin ölçeklenmesi gerekip gerekmediğini kontrol etmenin önemli olduğunu görmüştün. Verilerin ölçeklenmesinin iki yaygın nedeni olduğunu anımsa:
- Girdi değişkenleri farklı ölçü birimleri kullanıyor olabilir.
- Girdi değişkenlerinin varyansları önemli ölçüde farklı olabilir.
Bu egzersiz
R ile Denetimsiz Öğrenme
kursunun bir parçasıdırEgzersiz talimatları
Daha önce oluşturduğun wisc.data ve diagnosis değişkenleri çalışma alanında hâlâ mevcut.
- Verilerin özelliklerinin ortalama ve standart sapmalarını kontrol ederek ölçekleme gerekip gerekmediğine karar ver. Daha önce yaptığın gibi
colMeans()veapply()fonksiyonlarını kullan. - Gerekliyse ölçekleyerek
wisc.dataüzerinde PCA uygula ve modeliwisc.prdeğişkenine ata. - Sonuçların özetini
summary()fonksiyonuyla incele.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Check column means and standard deviations
# Execute PCA, scaling if appropriate: wisc.pr
# Look at summary of results