ComeçarComece de graça

Visualização da separação de classes com PCA I

Uma pergunta comum em entrevistas de Machine Learning é como visualizar a dimensionalidade após aplicar PCA. Neste exercício, você fará exatamente isso ao plotar os 2 primeiros componentes principais de loan_data para visualizar a separação das classes entre os componentes, considerando se o status do empréstimo foi totalmente pago ou baixado como prejuízo.

O conjunto de dados loan_data já foi padronizado e passou por one-hot encoding, ou seja, variáveis categóricas foram transformadas em indicadores binários, pois os atributos precisam estar na mesma escala e ser numéricos antes do PCA.

Um modelo de PCA com 2 PCs e a configuração de um gráfico com rótulos de x e y e título já foram preparados para você. Você usará um DataFrame chamado loan_data_PCA nos exercícios. Os valores possíveis para a variável-alvo Loan Status são 0 e 1. Você irá plotar PC1 no eixo x e PC2 no eixo y.

Já foram importados para você matplotlib.pyplot como plt, seaborn como sns, PCA de sklearn.decomposition.

Este exercício faz parte do curso

Praticando perguntas de entrevista de Machine Learning em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

targets = [____, ____]
colors = ['r', 'b']

# For loop to create plot
for target, color in zip(____, ____):
    indicesToKeep = ____['____'] == ____
Editar e executar o código