ComenzarEmpieza gratis

Utilizar PCA

En este ejercicio, aplicarás PCA al conjunto de datos wine, para ver si puedes aumentar la precisión del modelo.

Este ejercicio forma parte del curso

Preprocesamiento para machine learning en Python

Ver curso

Instrucciones de ejercicio

  • Instanciar un objeto PCA.
  • Define las características (X) y las etiquetas (y) de wine, utilizando las etiquetas de la columna "Type".
  • Aplica PCA a X_train y X_test, asegurándote de que no haya fugas de datos, y almacena los valores transformados como pca_X_train y pca_X_test.
  • Imprime el atributo .explained_variance_ratio_ de pca para comprobar cuánta varianza explica cada componente.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Instantiate a PCA object
pca = ____()

# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)

# Look at the percentage of variance explained by the different components
print(____)
Editar y ejecutar código