MulaiMulai sekarang secara gratis

Isu praktis: penskalaan

Dalam video, Anda melihat bahwa melakukan penskalaan pada data sebelum PCA akan mengubah hasil pemodelan PCA. Di sini, Anda akan menjalankan PCA dengan dan tanpa penskalaan, lalu memvisualisasikan hasilnya menggunakan biplot.

Terkadang penskalaan tepat digunakan ketika ragam antarvariabel sangat berbeda. Ini umum terjadi ketika variabel memiliki satuan pengukuran yang berbeda, misalnya derajat Fahrenheit (suhu) dan mil (jarak). Memutuskan untuk menggunakan penskalaan merupakan langkah penting dalam melakukan analisis komponen utama.

Latihan ini adalah bagian dari kursus

Unsupervised Learning di R

Lihat Kursus

Petunjuk latihan

Himpunan data Pokemon yang sama tersedia di ruang kerja Anda sebagai pokemon, tetapi satu variabel baru telah ditambahkan: Total.

  • Terdapat beberapa kode di bagian atas editor untuk menghitung mean dan simpangan baku setiap variabel dalam model. Jalankan kode ini untuk melihat bagaimana skala variabel berbeda dalam data asli.
  • Buat model PCA dari pokemon dengan penskalaan, dan simpan hasilnya ke pr.with.scaling.
  • Buat model PCA dari pokemon tanpa penskalaan, dan simpan hasilnya ke pr.without.scaling.
  • Gunakan biplot() untuk memplot kedua model tersebut (satu per satu) lalu bandingkan keluarannya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Mean of each variable
colMeans(pokemon)

# Standard deviation of each variable
apply(pokemon, 2, sd)

# PCA model with scaling: pr.with.scaling


# PCA model without scaling: pr.without.scaling


# Create biplots of both for comparison

Edit dan Jalankan Kode