MulaiMulai sekarang secara gratis

Varians dari fitur PCA

Himpunan data ikan memiliki 6 dimensi. Namun, berapa dimensi intrinsiknya? Buat plot varians dari fitur PCA untuk mengetahui jawabannya. Seperti sebelumnya, samples adalah array 2D, di mana setiap baris merepresentasikan satu ikan. Anda perlu menstandarkan fitur terlebih dahulu.

Latihan ini adalah bagian dari kursus

Unsupervised Learning in Python

Lihat Kursus

Petunjuk latihan

  • Buat instance StandardScaler bernama scaler.
  • Buat instance PCA bernama pca.
  • Gunakan fungsi make_pipeline() untuk membuat pipeline yang merangkai scaler dan pca.
  • Gunakan metode .fit() dari pipeline untuk menyesuaikannya dengan sampel ikan samples.
  • Ekstrak jumlah komponen yang digunakan dengan atribut .n_components_ dari pca. Letakkan ini di dalam fungsi range() dan simpan hasilnya sebagai features.
  • Gunakan fungsi plt.bar() untuk memplot varians yang dijelaskan, dengan features pada sumbu-x dan pca.explained_variance_ pada sumbu-y.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt

# Create scaler: scaler
scaler = ____

# Create a PCA instance: pca
pca = ____

# Create pipeline: pipeline
pipeline = ____

# Fit the pipeline to 'samples'
____

# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()
Edit dan Jalankan Kode