Usando PCA
Neste exercício, você vai aplicar PCA ao conjunto de dados wine para ver se consegue aumentar a acurácia do modelo.
Este exercício faz parte do curso
Pré-processamento para Machine Learning em Python
Instruções do exercício
- Instancie um objeto
PCA. - Defina as features (
X) e os rótulos (y) a partir dewine, usando os rótulos na coluna"Type". - Aplique PCA a
X_traineX_test, garantindo que não haja vazamento de dados, e armazene os valores transformados comopca_X_trainepca_X_test. - Imprima o atributo
.explained_variance_ratio_depcapara verificar quanta variância é explicada por cada componente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Instantiate a PCA object
pca = ____()
# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)
# Look at the percentage of variance explained by the different components
print(____)