Varians dari fitur PCA
Himpunan data ikan memiliki 6 dimensi. Namun, berapa dimensi intrinsiknya? Buat plot varians dari fitur PCA untuk mengetahui jawabannya. Seperti sebelumnya, samples adalah array 2D, di mana setiap baris merepresentasikan satu ikan. Anda perlu menstandarkan fitur terlebih dahulu.
Latihan ini merupakan bagian dari kursus
Unsupervised Learning in Python
Instruksi latihan
- Buat instance
StandardScalerbernamascaler. - Buat instance
PCAbernamapca. - Gunakan fungsi
make_pipeline()untuk membuat pipeline yang merangkaiscalerdanpca. - Gunakan metode
.fit()daripipelineuntuk menyesuaikannya dengan sampel ikansamples. - Ekstrak jumlah komponen yang digunakan dengan atribut
.n_components_daripca. Letakkan ini di dalam fungsirange()dan simpan hasilnya sebagaifeatures. - Gunakan fungsi
plt.bar()untuk memplot varians yang dijelaskan, denganfeaturespada sumbu-x danpca.explained_variance_pada sumbu-y.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()