1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Finance in Python

Connected

Cvičení

Ladění hyperparametrů náhodného lesa

Stejně jako u jiných modelů chceme optimalizovat výkon pomocí ladění hyperparametrů. Náhodné lesy mají mnoho hyperparametrů, ale nejdůležitější bývá počet příznaků, které vybereme při každém rozdělení – v RandomForestRegressor z knihovny sklearn je to parametr max_features. U modelů, jako jsou náhodné lesy, které mají zabudovanou náhodnost, chceme také nastavit random_state, aby byly naše výsledky reprodukovatelné.

Obvykle bychom mohli k prohledávání hyperparametrů použít metodu GridSearchCV() ze sklearn, ale v případě finančních časových řad nechceme provádět křížovou validaci, protože by docházelo k míchání dat. Modely chceme trénovat na starších datech a vyhodnocovat na novějších. Proto použijeme ParameterGrid ze sklearn, které nám vytvoří kombinace hyperparametrů k prohledání.

Pokyny

100 XP
  • Nastav hyperparametr n_estimators jako seznam s jednou hodnotou (200) ve slovníku grid.
  • Nastav hyperparametr max_features jako seznam obsahující hodnoty 4 a 8 ve slovníku grid.
  • Natrénuj model regresoru náhodného lesa (rfr, který je již připraven) na train_features a train_targets s každou kombinací hyperparametrů g v cyklu.
  • Vypočítej R\(^2\) pomocí rfr.score() na test_features a výsledek přidej do seznamu test_scores.