Komponen utama pertama
Komponen utama pertama dari data adalah arah di mana data memiliki variasi terbesar. Pada latihan ini, tugas Anda adalah menggunakan PCA untuk menemukan komponen utama pertama dari pengukuran panjang dan lebar sampel biji, lalu merepresentasikannya sebagai sebuah panah pada plot sebar.
Array grains berisi panjang dan lebar sampel biji. PyPlot (plt) dan PCA sudah diimpor untuk Anda.
Latihan ini adalah bagian dari kursus
Unsupervised Learning in Python
Petunjuk latihan
- Buat plot sebar untuk pengukuran biji. Ini telah dilakukan untuk Anda.
- Buat sebuah instans
PCAbernamamodel. - Sesuaikan model ke data
grains. - Ekstrak koordinat rata-rata data menggunakan atribut
.mean_darimodel. - Ambil komponen utama pertama dari
modelmenggunakan atribut.components_[0,:]. - Plot komponen utama pertama sebagai sebuah panah pada plot sebar menggunakan fungsi
plt.arrow(). Anda harus menentukan dua argumen pertama —mean[0]danmean[1].
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Make a scatter plot of the untransformed points
plt.scatter(grains[:,0], grains[:,1])
# Create a PCA instance: model
model = ____
# Fit model to points
____
# Get the mean of the grain samples: mean
mean = ____
# Get the first principal component: first_pc
first_pc = ____
# Plot first_pc as an arrow, starting at mean
plt.arrow(____, ____, first_pc[0], first_pc[1], color='red', width=0.01)
# Keep axes on same scale
plt.axis('equal')
plt.show()