Předpovídáme hodnocení aplikace

V předchozím cvičení jsi prozkoumал/a dataset aplikací z Google Play. Teď sestrojíme model, který na základě vybraných vlastností aplikace odhadne její hodnocení.

K tomu použijeme DecisionTreeRegressor z knihovny scikit-learn. Rozhodovací stromy tvoří základ mnoha ensemble modelů, takže si jejich fungování dobře zopakuj — bude se ti to v průběhu kurzu hodit.

Jako vyhodnocovací metriku použijeme MAE (střední absolutní chybu). Tato metrika je velmi srozumitelná — udává průměrný absolutní rozdíl mezi skutečným a předpovězeným hodnocením.

Všechny potřebné moduly jsou již naimportovány. Příznaky a cílová proměnná jsou dostupné v proměnných X a y.

Pomocí train_test_split() rozděl X a y na trénovací a testovací sadu. Jako velikost testovací sady použij 20 %, tedy 0.2.
Vytvoř instanci DecisionTreeRegressor() s názvem reg_dt a nastav tyto hyperparametry: min_samples_leaf = 3 a min_samples_split = 9.
Natrénuj regresor na trénovací sadě pomocí .fit().
Předpověz štítky testovací sady pomocí .predict().

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení