1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w finansach z Pythonem

Connected

ćwiczenie

Dostrajanie hiperparametrów lasu losowego

Podobnie jak w przypadku innych modeli, chcemy zoptymalizować wydajność przez dostrojenie hiperparametrów. Lasy losowe mają wiele hiperparametrów, ale najważniejszym jest często liczba cech losowanych przy każdym podziale – w RandomForestRegressor z biblioteki sklearn odpowiada za to parametr max_features. W modelach takich jak lasy losowe, które mają wbudowany element losowości, warto też ustawić random_state, aby wyniki były powtarzalne.

Zazwyczaj do przeszukiwania hiperparametrów można użyć metody GridSearchCV() ze sklearn, jednak w przypadku finansowych szeregów czasowych nie chcemy stosować walidacji krzyżowej – mogłoby to doprowadzić do mieszania danych. Zależy nam na tym, żeby modele były trenowane na starszych danych i oceniane na nowszych. Dlatego użyjemy ParameterGrid ze sklearn, aby wygenerować kombinacje hiperparametrów do przeszukania.

Instrukcje

100 XP
  • Ustaw hiperparametr n_estimators jako listę z jedną wartością (200) w słowniku grid.
  • Ustaw hiperparametr max_features jako listę zawierającą wartości 4 i 8 w słowniku grid.
  • Dopasuj model regresji lasu losowego (rfr, już utworzony) do train_features i train_targets dla każdej kombinacji hiperparametrów g w pętli.
  • Oblicz R\(^2\), używając rfr.score() na test_features, i dołącz wynik do listy test_scores.