Menafsirkan hasil PCA
Sekarang Anda akan menggunakan beberapa visualisasi untuk lebih memahami model PCA Anda. Salah satu visualisasi ini, yaitu biplot, telah diperkenalkan di bab sebelumnya.
Anda akan menemui beberapa tantangan umum saat menggunakan biplot pada data dunia nyata yang memiliki jumlah observasi dan variabel yang tidak sedikit, lalu Anda akan melihat beberapa visualisasi alternatif. Anda dianjurkan untuk bereksperimen dengan visualisasi tambahan sebelum melanjutkan ke latihan berikutnya.
Latihan ini adalah bagian dari kursus
Unsupervised Learning di R
Petunjuk latihan
Variabel yang Anda buat sebelumnya, wisc.data, diagnosis, dan wisc.pr, masih tersedia.
- Buat biplot dari data
wisc.pr. Apa yang menonjol bagi Anda dari plot ini? Apakah mudah atau sulit dipahami? Mengapa? - Jalankan kode untuk membuat scatter plot setiap observasi berdasarkan principal components 1 dan 2, dengan memberi warna pada titik berdasarkan diagnosis.
- Ulangi hal yang sama untuk principal components 1 dan 3. Apa yang Anda perhatikan dari plot ini?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a biplot of wisc.pr
# Scatter plot observations by components 1 and 2
plot(wisc.pr$___[, c(1, 2)], col = (diagnosis + 1),
xlab = "PC1", ylab = "PC2")
# Repeat for components 1 and 3
plot(___, col = (diagnosis + 1),
xlab = "PC1", ylab = "PC3")
# Do additional data exploration of your choosing below (optional)