Twój pierwszy pipeline – jeszcze raz!

W startupie zajmującym się arytmią zbliża się miesięczny przegląd pracy, a doświadczony programista Pythona przyjrzy się twojemu kodowi. Postanawiasz go uporządkować zgodnie z najlepszymi praktykami i zastąpić skrypt do selekcji cech i klasyfikacji lasem losowym potokiem przetwarzania (pipeline). Dysponujesz zbiorem treningowym dostępnym jako X_train i y_train, a także następującymi modułami: RandomForestClassifier, SelectKBest() i f_classif() do selekcji cech oraz GridSearchCV i Pipeline.

Utwórz pipeline z selektorem cech podanym w przykładowym kodzie oraz klasyfikatorem lasu losowego. Nazwij pierwszy krok feature_selection.
Dodaj do params dwie pary klucz–wartość: jedną dla liczby cech k w selektorze z wartościami 10 i 20, drugą dla n_estimators w lesie losowym z możliwymi wartościami 2 i 5.
Zainicjuj obiekt GridSearchCV, przekazując mu przygotowany pipeline oraz siatkę parametrów.
Dopasuj obiekt do danych i wyświetl najlepszą znalezioną kombinację parametrów.

ćwiczenie

Twój pierwszy pipeline – jeszcze raz!

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie