Menskalakan Data Sebelum PCA
Saat bekerja dengan data yang memiliki fitur dengan skala berbeda, sering kali penting untuk menskalakan data terlebih dahulu. Ini karena data dengan nilai yang lebih besar dapat memengaruhi hasil meskipun variabilitasnya relatif kecil.
Data frame combine sudah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Aljabar Linear untuk Data Science di R
Petunjuk latihan
- Gunakan fungsi
scale()untuk menskalakan kolom ke-5 hingga ke-12 dari datacombine. Beri nama data frame iniBdan tampilkan beberapa nilainya denganhead(). - Gunakan
prcomp()untuk melakukan principal component analysis pada data dan rangkum analisis ini menggunakansummary().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Scale columns 5-12 of combine
B <- ___(___[, 5:12])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
summary(____(B))