1. Nauka
  2. /
  3. Kursy
  4. /
  5. Projektowanie przepływów pracy uczenia maszynowego w Pythonie

Connected

ćwiczenie

Twój pierwszy pipeline – jeszcze raz!

W startupie zajmującym się arytmią zbliża się miesięczny przegląd pracy, a doświadczony programista Pythona przyjrzy się twojemu kodowi. Postanawiasz go uporządkować zgodnie z najlepszymi praktykami i zastąpić skrypt do selekcji cech i klasyfikacji lasem losowym potokiem przetwarzania (pipeline). Dysponujesz zbiorem treningowym dostępnym jako X_train i y_train, a także następującymi modułami: RandomForestClassifier, SelectKBest() i f_classif() do selekcji cech oraz GridSearchCV i Pipeline.

Instrukcje

100 XP
  • Utwórz pipeline z selektorem cech podanym w przykładowym kodzie oraz klasyfikatorem lasu losowego. Nazwij pierwszy krok feature_selection.
  • Dodaj do params dwie pary klucz–wartość: jedną dla liczby cech k w selektorze z wartościami 10 i 20, drugą dla n_estimators w lesie losowym z możliwymi wartościami 2 i 5.
  • Zainicjuj obiekt GridSearchCV, przekazując mu przygotowany pipeline oraz siatkę parametrów.
  • Dopasuj obiekt do danych i wyświetl najlepszą znalezioną kombinację parametrów.