Memahami komponen utama
Principal component analysis (PCA) mengurangi dimensi dengan menggabungkan informasi fitur yang tidak tumpang tindih. PCA mengekstraksi fitur baru yang disebut komponen utama yang saling independen. Salah satu cara untuk memahami PCA adalah dengan memplot komponen utama terbesar pada sumbu x dan y serta menampilkan vektor fiturnya. Ini memungkinkan Anda melihat fitur mana yang berkontribusi pada setiap komponen utama. Walaupun tidak selalu mudah, merupakan praktik yang baik untuk menamai komponen utama berdasarkan fitur-fitur yang menyumbang padanya. Namun, sebagai metode ekstraksi fitur, PCA sering kali sulit ditafsirkan.
Subkumpulan data kredit terdapat dalam credit_df. Variabel targetnya adalah credit_score. Paket tidyverse dan ggfortify juga telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Reduksi Dimensi di R
Petunjuk latihan
- Lakukan principal component analysis pada
credit_df. - Gunakan
autoplot()untuk menampilkan dua komponen utama pertama, vektor dan label fitur, serta mengodekancredit_scoredalam warna.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Perform PCA
pca_res <- ___(___ %>% select(-___), scale. = ___)
# Plot principal components and feature vectors
___(___,
data = ___,
colour = '___',
alpha = 0.3,
loadings = ___,
loadings.label = ___,
loadings.colour = "black",
loadings.label.colour = "black")