ComenzarEmpieza gratis

Visualización de la separación de clases con PCA I

Una pregunta habitual en entrevistas de Machine Learning es cómo visualizar la dimensionalidad tras aplicar PCA. En este ejercicio, harás justo eso: representar los 2 primeros componentes principales de loan_data para visualizar la separación de clases entre ambos componentes según si el estado del préstamo ha sido totalmente pagado o dado de baja.

El conjunto de datos loan_data ya está escalado y codificado con one-hot, es decir, las variables categóricas se transformaron en indicadores binarios, ya que las características deben estar en la misma escala y ser numéricas antes de aplicar PCA.

Ya tienes preparado un modelo de PCA con 2 componentes principales y una figura con etiquetas en los ejes x e y y un título. Usarás un DataFrame llamado loan_data_PCA en los ejercicios. Los valores posibles de la variable objetivo Loan Status son 0 y 1. Representarás PC1 en el eje x y PC2 en el eje y.

Ya se han importado por ti matplotlib.pyplot como plt, seaborn como sns y PCA de sklearn.decomposition.

Este ejercicio forma parte del curso

Practicing Machine Learning Interview Questions in Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

targets = [____, ____]
colors = ['r', 'b']

# For loop to create plot
for target, color in zip(____, ____):
    indicesToKeep = ____['____'] == ____
Editar y ejecutar código