1. 학습
  2. /
  3. 강의
  4. /
  5. Ćwiczenie pytań rekrutacyjnych z uczenia maszynowego w Pythonie

Connected

연습 문제

Analiza głównych składowych

W poprzednich 2 rozdziałach poznałeś różne sposoby redukcji wymiarowości zbioru danych, w tym regularyzację i selekcję cech. Umiejętność wyjaśnienia różnych podejść do redukcji wymiarowości jest ważna podczas rozmowy kwalifikacyjnej z uczenia maszynowego. Duże zbiory danych wymagają długiego czasu obliczeń, a szum w danych może zaburzać wyniki.

Jedną z metod redukcji wymiarowości jest analiza głównych składowych (PCA). To skuteczna technika zmniejszania rozmiaru danych poprzez tworzenie nowych cech, które zachowują najważniejsze informacje ze zbioru danych, eliminując jednocześnie wielokoliniowość. W tym ćwiczeniu skorzystasz z modułu sklearn.decomposition, aby wykonać PCA na cechach zbioru danych diabetes, wyodrębniając zmienną docelową progression.

Oto, na jakim etapie potoku się teraz znajdujesz:

Machine learning pipeline

지침 1/4

undefined XP
    1
    2
    3
    4
  • Zaimportuj odpowiedni moduł do wykonania PCA.
  • Utwórz macierz cech X i tablicę docelową y ze zmienną progression ze zbioru danych diabetes.