Técnicas para multicolinearidade - PCA
No último exercício, você usou engenharia de atributos para combinar as variáveis independentes s1 e s2 em s1_s2, já que elas apresentaram a maior correlação no conjunto de dados diabetes.
Neste exercício, você vai aplicar PCA em diabetes para remover a multicolinearidade antes de ajustar uma Regressão Linear. Depois, vai comparar as métricas geradas com as do exercício anterior. Por fim, vai visualizar como ficam a matriz de correlação e o heatmap do conjunto de dados, já que o PCA remove completamente a multicolinearidade.
Este exercício faz parte do curso
Praticando perguntas de entrevista de Machine Learning em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import
from sklearn.decomposition import ____
# Instantiate
pca = ____()
# Fit on train
pca.____(____)
# Transform train and test
X_trainPCA = pca.____(____)
X_testPCA = pca.____(____)