1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

cvičení

Techniky multikolinearity – PCA

V předchozím cvičení jsi použil/a feature engineering ke sloučení nezávislých proměnných s1 a s2 do proměnné s1_s2, protože vykazovaly nejvyšší korelaci v datasetu diabetes.

V tomto cvičení provedeš PCA na datasetu diabetes, abys odstranil/a multikolinearitu před aplikací lineární regrese. Poté porovnáš výstupní metriky s výsledky z předchozího cvičení. Nakonec si vizualizuješ korelační matici a heatmapu datasetu – uvidíš, jak PCA multikolinearitu zcela eliminuje.

Instrukce 1/3

undefined XP
  • 1
    • Importuj potřebné moduly pro provedení PCA.
    • Vytvoř instanci a proveď trénování.
    • Transformuj trénovací a testovací data zvlášť.
  • 2
    • Vytvoř instanci lineární regrese, natrénuj ji a proveď predikce na datasetu transformovaném pomocí PCA.
    • Vypiš koeficienty modelu, MSE a koeficient determinace R².
  • 3
    • Vytvoř korelační matici a zobraz ji jako heatmapu.
    • Vypiš matici a prozkoumej vztahy mezi nezávislými proměnnými.