PCA özelliklerinin varyansı
Balık veri kümesi 6 boyutlu. Peki onun özünde (intrinsic) boyutu nedir? Bunu bulmak için PCA özelliklerinin varyanslarının grafiğini çiz. Daha önce olduğu gibi, samples 2B bir dizidir ve her satır bir balığı temsil eder. Önce özellikleri standartlaştırman gerekecek.
Bu egzersiz
Python'da Unsupervised Learning
kursunun bir parçasıdırEgzersiz talimatları
scaleradlı birStandardScalerörneği oluştur.pcaadlı birPCAörneği oluştur.make_pipeline()fonksiyonunu kullanarakscalervepca’yı zincirleyen bir boru hattı (pipeline) oluştur.pipeline’ın.fit()metodunu kullanarak balık örneklerisamplesüzerine uydur.pca’nın.n_components_özniteliğini kullanarak kullanılan bileşen sayısını çıkar. Bunurange()fonksiyonunun içine koy ve sonucufeaturesolarak sakla.- Açıklanan varyansları çizmek için
plt.bar()fonksiyonunu kullan; x eksenindefeatures, y eksenindepca.explained_variance_olsun.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Perform the necessary imports
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import make_pipeline
import matplotlib.pyplot as plt
# Create scaler: scaler
scaler = ____
# Create a PCA instance: pca
pca = ____
# Create pipeline: pipeline
pipeline = ____
# Fit the pipeline to 'samples'
____
# Plot the explained variances
features = ____
plt.bar(____, ____)
plt.xlabel('PCA feature')
plt.ylabel('variance')
plt.xticks(features)
plt.show()