Menggunakan PCA
Dalam latihan ini, Anda akan menerapkan PCA pada himpunan data wine untuk melihat apakah Anda dapat meningkatkan akurasi model.
Latihan ini merupakan bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Instruksi latihan
- Instansiasi objek
PCA. - Tentukan fitur (
X) dan label (y) dariwine, menggunakan label pada kolom"Type". - Terapkan PCA pada
X_traindanX_test, pastikan tidak terjadi kebocoran data, lalu simpan nilai yang telah ditransformasikan sebagaipca_X_traindanpca_X_test. - Cetak atribut
.explained_variance_ratio_daripcauntuk memeriksa seberapa besar ragam yang dijelaskan oleh setiap komponen.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Instantiate a PCA object
pca = ____()
# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)
# Look at the percentage of variance explained by the different components
print(____)