Menskalakan Data Sebelum PCA
Saat bekerja dengan data yang memiliki fitur dengan skala berbeda, sering kali penting untuk menskalakan data terlebih dahulu. Ini karena data dengan nilai yang lebih besar dapat memengaruhi hasil meskipun variabilitasnya relatif kecil.
Data frame combine sudah dimuat untuk Anda.
Latihan ini merupakan bagian dari kursus
Aljabar Linear untuk Data Science di R
Instruksi latihan
- Gunakan fungsi
scale()untuk menskalakan kolom ke-5 hingga ke-12 dari datacombine. Beri nama data frame iniBdan tampilkan beberapa nilainya denganhead(). - Gunakan
prcomp()untuk melakukan principal component analysis pada data dan rangkum analisis ini menggunakansummary().
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Scale columns 5-12 of combine
B <- ___(___[, 5:12])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
summary(____(B))