MulaiMulai sekarang secara gratis

Menafsirkan hasil PCA

Sekarang Anda akan menggunakan beberapa visualisasi untuk lebih memahami model PCA Anda. Salah satu visualisasi ini, yaitu biplot, telah diperkenalkan di bab sebelumnya.

Anda akan menemui beberapa tantangan umum saat menggunakan biplot pada data dunia nyata yang memiliki jumlah observasi dan variabel yang tidak sedikit, lalu Anda akan melihat beberapa visualisasi alternatif. Anda dianjurkan untuk bereksperimen dengan visualisasi tambahan sebelum melanjutkan ke latihan berikutnya.

Latihan ini adalah bagian dari kursus

Unsupervised Learning di R

Lihat Kursus

Petunjuk latihan

Variabel yang Anda buat sebelumnya, wisc.data, diagnosis, dan wisc.pr, masih tersedia.

  • Buat biplot dari data wisc.pr. Apa yang menonjol bagi Anda dari plot ini? Apakah mudah atau sulit dipahami? Mengapa?
  • Jalankan kode untuk membuat scatter plot setiap observasi berdasarkan principal components 1 dan 2, dengan memberi warna pada titik berdasarkan diagnosis.
  • Ulangi hal yang sama untuk principal components 1 dan 3. Apa yang Anda perhatikan dari plot ini?

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a biplot of wisc.pr


# Scatter plot observations by components 1 and 2
plot(wisc.pr$___[, c(1, 2)], col = (diagnosis + 1), 
     xlab = "PC1", ylab = "PC2")

# Repeat for components 1 and 3
plot(___, col = (diagnosis + 1), 
     xlab = "PC1", ylab = "PC3")

# Do additional data exploration of your choosing below (optional)
Edit dan Jalankan Kode