Natrénuj rozhodovací strom

Random forests jsou oblíbenou volbou pro předpovědi – fungují dobře hned po vybalení. Nejdřív se ale podíváme na jejich stavební kámen: rozhodovací stromy.

Rozhodovací stromy rozdělují data do skupin podle příznaků. Začínají kořenovým uzlem a postupně data dělí, dokud nedosáhnou listových uzlů.

decision tree

K natrénování rozhodovacího stromu použijeme sklearn s třídou DecisionTreeRegressor a metodou .fit(features, targets).

Pokud hloubku stromu nijak neomezíme, bude data dělit tak dlouho, dokud každý list neobsahuje právě 1 vzorek – což je učebnicový příklad přeučení (overfittingu). Více o přeučení si řekneme v dalších kapitolách.

Toto cvičení je součástí kurzu

Machine Learning for Finance in Python

Zobrazit kurz

Pokyny k cvičení

Vytvoř model rozhodovacího stromu s názvem decision_tree pomocí importované třídy DecisionTreeRegressor s výchozími argumenty (tj. bez argumentů).
Natrénuj model na datech train_features a train_targets, která jsme připravili dříve (a nyní obsahují příznaky pro den v týdnu a objem obchodů).
Vypiš skóre na trénovacích datech (train_features a train_targets) i na testovacích datech (test_features a test_targets).

Interaktivní cvičení na vyzkoušení si v praxi

Vyzkoušejte si toto cvičení dokončením tohoto ukázkového kódu.

from sklearn.tree import DecisionTreeRegressor

# Create a decision tree regression model with default arguments
decision_tree = ____

# Fit the model to the training features and targets
decision_tree.fit(____)

# Check the score on train and test
print(decision_tree.score(train_features, train_targets))
print(decision_tree.score(____))

Upravit a spustit kód