Varians dari fitur PCA
Himpunan data ikan memiliki 6 dimensi. Namun, berapa dimensi intrinsiknya? Buat plot varians dari fitur PCA untuk mengetahui jawabannya. Seperti sebelumnya, samples adalah array 2D, di mana setiap baris merepresentasikan satu ikan. Anda perlu menstandarkan fitur terlebih dahulu.
Latihan ini adalah bagian dari kursus
Unsupervised Learning in Python
Petunjuk latihan
- Buat instance
StandardScalerbernamascaler. - Buat instance
PCAbernamapca. - Gunakan fungsi
make_pipeline()untuk membuat pipeline yang merangkaiscalerdanpca. - Gunakan metode
.fit()daripipelineuntuk menyesuaikannya dengan sampel ikansamples. - Ekstrak jumlah komponen yang digunakan dengan atribut
.n_components_daripca. Letakkan ini di dalam fungsirange()dan simpan hasilnya sebagaifeatures. - Gunakan fungsi
plt.bar()untuk memplot varians yang dijelaskan, denganfeaturespada sumbu-x danpca.explained_variance_pada sumbu-y.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()