1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Finance in Python

Connected

Cvičení

Natrénuj rozhodovací strom

Random forests jsou oblíbenou volbou pro předpovědi – fungují dobře hned po vybalení. Nejdřív se ale podíváme na jejich stavební kámen: rozhodovací stromy.

Rozhodovací stromy rozdělují data do skupin podle příznaků. Začínají kořenovým uzlem a postupně data dělí, dokud nedosáhnou listových uzlů.

decision tree

K natrénování rozhodovacího stromu použijeme sklearn s třídou DecisionTreeRegressor a metodou .fit(features, targets).

Pokud hloubku stromu nijak neomezíme, bude data dělit tak dlouho, dokud každý list neobsahuje právě 1 vzorek – což je učebnicový příklad přeučení (overfittingu). Více o přeučení si řekneme v dalších kapitolách.

Pokyny

100 XP
  • Vytvoř model rozhodovacího stromu s názvem decision_tree pomocí importované třídy DecisionTreeRegressor s výchozími argumenty (tj. bez argumentů).
  • Natrénuj model na datech train_features a train_targets, která jsme připravili dříve (a nyní obsahují příznaky pro den v týdnu a objem obchodů).
  • Vypiš skóre na trénovacích datech (train_features a train_targets) i na testovacích datech (test_features a test_targets).