1. Apprendre
  2. /
  3. Cours
  4. /
  5. Machine Learning pentru finanțe în Python

Connected

Exercice

Ajustează hiperparametrii pădurii aleatoare

Ca pentru orice model, vrem să optimizăm performanța prin ajustarea hiperparametrilor. Pădurile aleatoare au mulți hiperparametri, dar cel mai important este adesea numărul de caracteristici eșantionate la fiecare diviziune – max_features în RandomForestRegressor din biblioteca sklearn. Pentru modelele precum pădurile aleatoare, care au aleatorietate încorporată, vrem să setăm și random_state, astfel încât rezultatele să fie reproductibile.

De obicei, putem folosi metoda GridSearchCV() din sklearn pentru a căuta hiperparametrii optimi, însă în cazul unei serii de timp financiare nu dorim validare încrucișată, deoarece datele s-ar amesteca. Vrem să antrenăm modelele pe datele mai vechi și să le evaluăm pe cele mai recente. Prin urmare, vom folosi ParameterGrid din sklearn pentru a genera combinații de hiperparametri pe care să le explorăm.

Instructions

100 XP
  • Setează hiperparametrul n_estimators ca o listă cu o singură valoare (200) în dicționarul grid.
  • Setează hiperparametrul max_features ca o listă care conține valorile 4 și 8 în dicționarul grid.
  • Antrenează modelul de regresie cu pădure aleatoare (rfr, deja creat pentru tine) pe train_features și train_targets pentru fiecare combinație de hiperparametri g din buclă.
  • Calculează R\(^2\) folosind rfr.score() pe test_features și adaugă rezultatul în lista test_scores.