Menggunakan PCA
Dalam latihan ini, Anda akan menerapkan PCA pada himpunan data wine untuk melihat apakah Anda dapat meningkatkan akurasi model.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Instansiasi objek
PCA. - Tentukan fitur (
X) dan label (y) dariwine, menggunakan label pada kolom"Type". - Terapkan PCA pada
X_traindanX_test, pastikan tidak terjadi kebocoran data, lalu simpan nilai yang telah ditransformasikan sebagaipca_X_traindanpca_X_test. - Cetak atribut
.explained_variance_ratio_daripcauntuk memeriksa seberapa besar ragam yang dijelaskan oleh setiap komponen.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Instantiate a PCA object
pca = ____()
# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)
# Look at the percentage of variance explained by the different components
print(____)