Utilizar PCA
En este ejercicio, aplicarás PCA al conjunto de datos wine
, para ver si puedes aumentar la precisión del modelo.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones de ejercicio
- Instanciar un objeto
PCA
. - Define las características (
X
) y las etiquetas (y
) dewine
, utilizando las etiquetas de la columna"Type"
. - Aplica PCA a
X_train
yX_test
, asegurándote de que no haya fugas de datos, y almacena los valores transformados comopca_X_train
ypca_X_test
. - Imprime el atributo
.explained_variance_ratio_
depca
para comprobar cuánta varianza explica cada componente.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Instantiate a PCA object
pca = ____()
# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)
# Look at the percentage of variance explained by the different components
print(____)