Melakukan PCA
Langkah berikutnya dalam analisis Anda adalah melakukan PCA pada wisc.data.
Pada bab sebelumnya Anda melihat bahwa penting untuk memeriksa apakah data perlu diskalakan sebelum melakukan PCA. Ingat dua alasan umum untuk melakukan penskalaan data:
- Variabel masukan menggunakan satuan ukur yang berbeda.
- Variabel masukan memiliki ragam yang sangat berbeda.
Latihan ini merupakan bagian dari kursus
Unsupervised Learning di R
Instruksi latihan
Variabel yang Anda buat sebelumnya, wisc.data dan diagnosis, masih tersedia di ruang kerja Anda.
- Periksa mean dan simpangan baku dari fitur data untuk menentukan apakah data perlu diskalakan. Gunakan fungsi
colMeans()danapply()seperti yang sudah Anda lakukan sebelumnya. - Jalankan PCA pada
wisc.data, lakukan penskalaan jika perlu, dan simpan modelnya kewisc.pr. - Tinjau ringkasan hasil dengan fungsi
summary().
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Check column means and standard deviations
# Execute PCA, scaling if appropriate: wisc.pr
# Look at summary of results