1. 学ぶ
  2. /
  3. コース
  4. /
  5. Ćwiczenie pytań rekrutacyjnych z uczenia maszynowego w Pythonie

Connected

演習

Metody filtrowania i owijania

Pytania dotyczące redukcji wymiarowości zbioru danych są bardzo częste podczas rozmów kwalifikacyjnych z uczenia maszynowego. Jednym ze sposobów na ograniczenie wymiarowości jest wybranie tylko istotnych cech ze zbioru danych.

W tym ćwiczeniu przećwiczysz metodę filtrowania na ramce danych diabetes, a następnie dwa różne rodzaje metod owijania z walidacją krzyżową. Do wizualizacji korelacji, przetwarzania danych i zastosowania technik selekcji cech użyjesz bibliotek pandas, matplotlib.pyplot i seaborn.

Macierz cech z usuniętą kolumną zmiennej docelowej (progression) jest załadowana jako X, natomiast zmienna docelowa – jako y.

Zwróć uwagę, że biblioteki pandas, matplotlib.pyplot i seaborn zostały już zaimportowane do przestrzeni roboczej odpowiednio jako pd, plt i sns.

Do potoku przetwarzania dodano krok Walidacja krzyżowa (który dotyczy ostatnich 3 kroków):

Machine learning pipeline

指示1 / 3

undefined XP
  • 1
    • Utwórz macierz korelacji dla diabetes i mapę cieplną, a następnie wybierz cechy o korelacji większej niż 50%.
  • 2
    • Utwórz estymator SVR z jądrem liniowym oraz selektor cech z 5-krotną walidacją krzyżową, a następnie dopasuj go do cech i zmiennej docelowej.
  • 3
    • Usuń z X nieistotną kolumnę znalezioną w kroku 2, utwórz obiekt LarsCV i dopasuj go do danych.