Melakukan PCA
Langkah berikutnya dalam analisis Anda adalah melakukan PCA pada wisc.data.
Pada bab sebelumnya Anda melihat bahwa penting untuk memeriksa apakah data perlu diskalakan sebelum melakukan PCA. Ingat dua alasan umum untuk melakukan penskalaan data:
- Variabel masukan menggunakan satuan ukur yang berbeda.
- Variabel masukan memiliki ragam yang sangat berbeda.
Latihan ini adalah bagian dari kursus
Unsupervised Learning di R
Petunjuk latihan
Variabel yang Anda buat sebelumnya, wisc.data dan diagnosis, masih tersedia di ruang kerja Anda.
- Periksa mean dan simpangan baku dari fitur data untuk menentukan apakah data perlu diskalakan. Gunakan fungsi
colMeans()danapply()seperti yang sudah Anda lakukan sebelumnya. - Jalankan PCA pada
wisc.data, lakukan penskalaan jika perlu, dan simpan modelnya kewisc.pr. - Tinjau ringkasan hasil dengan fungsi
summary().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Check column means and standard deviations
# Execute PCA, scaling if appropriate: wisc.pr
# Look at summary of results