MulaiMulai sekarang secara gratis

Komponen utama pertama

Komponen utama pertama dari data adalah arah di mana data memiliki variasi terbesar. Pada latihan ini, tugas Anda adalah menggunakan PCA untuk menemukan komponen utama pertama dari pengukuran panjang dan lebar sampel biji, lalu merepresentasikannya sebagai sebuah panah pada plot sebar.

Array grains berisi panjang dan lebar sampel biji. PyPlot (plt) dan PCA sudah diimpor untuk Anda.

Latihan ini adalah bagian dari kursus

Unsupervised Learning in Python

Lihat Kursus

Petunjuk latihan

  • Buat plot sebar untuk pengukuran biji. Ini telah dilakukan untuk Anda.
  • Buat sebuah instans PCA bernama model.
  • Sesuaikan model ke data grains.
  • Ekstrak koordinat rata-rata data menggunakan atribut .mean_ dari model.
  • Ambil komponen utama pertama dari model menggunakan atribut .components_[0,:].
  • Plot komponen utama pertama sebagai sebuah panah pada plot sebar menggunakan fungsi plt.arrow(). Anda harus menentukan dua argumen pertama — mean[0] dan mean[1].

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])

# Create a PCA instance: model
model = ____

# Fit model to points
____

# Get the mean of the grain samples: mean
mean = ____

# Get the first principal component: first_pc
first_pc = ____

# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)

# Keep axes on same scale
plt.axis('equal')
plt.show()
Edit dan Jalankan Kode