1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Exersează întrebări de interviu pentru Machine Learning în Python

Connected

Bài tập

Analiza componentelor principale

În ultimele 2 capitole, ai văzut diverse exemple despre cum să reduci dimensionalitatea setului de date, inclusiv prin regularizare și selecție de caracteristici. Este important să poți explica diferitele aspecte ale reducerii dimensionalității într-un interviu de machine learning. Seturile de date mari necesită timp îndelungat de procesare, iar zgomotul din date îți poate distorsiona rezultatele.

O modalitate de reducere a dimensionalității este analiza componentelor principale. Aceasta reprezintă o metodă eficientă de reducere a dimensiunilor datelor, prin crearea de noi caracteristici care păstrează cele mai relevante informații din set, eliminând în același timp multicoliniaritatea. În acest exercițiu, vei folosi modulul sklearn.decomposition pentru a aplica PCA pe caracteristicile setului de date diabetes, izolând variabila țintă progression.

Iată unde te afli în pipeline:

Machine learning pipeline

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Importă modulul necesar pentru a efectua PCA.
  • Creează matricea de caracteristici X și vectorul țintă y cu progression din setul de date diabetes.