Usando PCA
Neste exercício, você aplicará o PCA ao conjunto de dados wine para ver se consegue aumentar a precisão do modelo.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções do exercício
- Instanciar um objeto
PCA. - Defina os recursos (
X) e os rótulos (y) dewine, usando os rótulos da coluna"Type". - Aplique PCA a
X_traineX_test, garantindo que não haja vazamento de dados, e armazene os valores transformados comopca_X_trainepca_X_test. - Imprima o atributo
.explained_variance_ratio_depcapara verificar quanta variação é explicada por cada componente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Instantiate a PCA object
pca = ____()
# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)
# Look at the percentage of variance explained by the different components
print(____)