Técnicas contra la multicolinealidad - PCA
En el último ejercicio utilizaste ingeniería de características para combinar las variables independientes s1 y s2 como s1_s2, ya que mostraban la mayor correlación en el conjunto de datos diabetes.
En este ejercicio, vas a aplicar PCA sobre diabetes para eliminar la multicolinealidad antes de ajustar una Regresión Lineal. Después, compararás las métricas obtenidas con las del ejercicio anterior. Por último, visualizarás cómo quedan la matriz de correlación y su mapa de calor del conjunto de datos, ya que PCA elimina completamente la multicolinealidad.
Este ejercicio forma parte del curso
Practicing Machine Learning Interview Questions in Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import
from sklearn.decomposition import ____
# Instantiate
pca = ____()
# Fit on train
pca.____(____)
# Transform train and test
X_trainPCA = pca.____(____)
X_testPCA = pca.____(____)