Isu praktis: penskalaan
Dalam video, Anda melihat bahwa melakukan penskalaan pada data sebelum PCA akan mengubah hasil pemodelan PCA. Di sini, Anda akan menjalankan PCA dengan dan tanpa penskalaan, lalu memvisualisasikan hasilnya menggunakan biplot.
Terkadang penskalaan tepat digunakan ketika ragam antarvariabel sangat berbeda. Ini umum terjadi ketika variabel memiliki satuan pengukuran yang berbeda, misalnya derajat Fahrenheit (suhu) dan mil (jarak). Memutuskan untuk menggunakan penskalaan merupakan langkah penting dalam melakukan analisis komponen utama.
Latihan ini adalah bagian dari kursus
Unsupervised Learning di R
Petunjuk latihan
Himpunan data Pokemon yang sama tersedia di ruang kerja Anda sebagai pokemon, tetapi satu variabel baru telah ditambahkan: Total.
- Terdapat beberapa kode di bagian atas editor untuk menghitung mean dan simpangan baku setiap variabel dalam model. Jalankan kode ini untuk melihat bagaimana skala variabel berbeda dalam data asli.
- Buat model PCA dari
pokemondengan penskalaan, dan simpan hasilnya kepr.with.scaling. - Buat model PCA dari
pokemontanpa penskalaan, dan simpan hasilnya kepr.without.scaling. - Gunakan
biplot()untuk memplot kedua model tersebut (satu per satu) lalu bandingkan keluarannya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Mean of each variable
colMeans(pokemon)
# Standard deviation of each variable
apply(pokemon, 2, sd)
# PCA model with scaling: pr.with.scaling
# PCA model without scaling: pr.without.scaling
# Create biplots of both for comparison