1. Learn
  2. /
  3. Cursuri
  4. /
  5. Exersează întrebări de interviu pentru Machine Learning în Python

Connected

exercițiu

Tehnici pentru multicoliniaritate - PCA

În exercițiul anterior ai folosit ingineria caracteristicilor pentru a combina variabilele independente s1 și s2 într-o nouă variabilă, s1_s2, deoarece acestea prezentau cea mai ridicată corelație în setul de date diabetes.

În acest exercițiu, vei aplica PCA pe diabetes pentru a elimina multicoliniaritatea înainte de a folosi Regresia Liniară. Apoi, vei compara metricile obținute cu cele din exercițiul precedent. În final, vei vizualiza cum arată matricea de corelație și heatmap-ul setului de date după ce PCA elimină complet multicoliniaritatea.

Instrucțiuni 1/3

undefined XP
  • 1
    • Importă modulele necesare pentru a efectua PCA.
    • Instanțiază și antrenează modelul.
    • Transformă separat setul de antrenament și cel de testare.
  • 2
    • Instanțiază, antrenează și generează predicții cu o Regresie Liniară aplicată pe setul de date transformat prin PCA.
    • Afișează coeficienții modelului, MSE și R-pătrat.
  • 3
    • Creează o matrice de corelație și vizualizeaz-o într-un heatmap.
    • Afișează matricea pentru a explora relațiile dintre variabilele independente.