Usando PCA
Neste exercício, você aplicará o PCA ao conjunto de dados wine
para ver se consegue aumentar a precisão do modelo.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Instanciar um objeto
PCA
. - Defina os recursos (
X
) e os rótulos (y
) dewine
, usando os rótulos da coluna"Type"
. - Aplique PCA a
X_train
eX_test
, garantindo que não haja vazamento de dados, e armazene os valores transformados comopca_X_train
epca_X_test
. - Imprima o atributo
.explained_variance_ratio_
depca
para verificar quanta variação é explicada por cada componente.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Instantiate a PCA object
pca = ____()
# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)
# Look at the percentage of variance explained by the different components
print(____)