1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

Bài tập

Analýza hlavních komponent

V posledních 2 kapitolách jsi viděl/a různé způsoby, jak snížit dimenzionalitu datasetu – včetně regularizace a výběru příznaků. Schopnost vysvětlit různé přístupy ke snižování dimenzionality je důležitou součástí každého ML pohovoru. Velké datasety jsou výpočetně náročné a šum v datech může zkreslit výsledky.

Jednou z metod snižování dimenzionality je analýza hlavních komponent (PCA). Jde o účinný způsob, jak zmenšit objem dat tím, že se vytvoří nové příznaky zachycující nejdůležitější informace v datasetu a zároveň odstraňující multikolinearitu. V tomto cvičení použiješ modul sklearn.decomposition k provedení PCA na příznacích datasetu diabetes a zároveň izoluješ cílovou proměnnou progression.

Tady se v pipeline právě nacházíš:

Machine learning pipeline

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Importuj příslušný modul pro provedení PCA.
  • Vytvoř matici příznaků X a cílové pole y s hodnotami progression z datasetu diabetes.