1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ensemble Methods in Python

Connected

cvičení

Předpovídáme hodnocení aplikace

V předchozím cvičení jsi prozkoumал/a dataset aplikací z Google Play. Teď sestrojíme model, který na základě vybraných vlastností aplikace odhadne její hodnocení.

K tomu použijeme DecisionTreeRegressor z knihovny scikit-learn. Rozhodovací stromy tvoří základ mnoha ensemble modelů, takže si jejich fungování dobře zopakuj — bude se ti to v průběhu kurzu hodit.

Jako vyhodnocovací metriku použijeme MAE (střední absolutní chybu). Tato metrika je velmi srozumitelná — udává průměrný absolutní rozdíl mezi skutečným a předpovězeným hodnocením.

Všechny potřebné moduly jsou již naimportovány. Příznaky a cílová proměnná jsou dostupné v proměnných X a y.

Pokyny

100 XP
  • Pomocí train_test_split() rozděl X a y na trénovací a testovací sadu. Jako velikost testovací sady použij 20 %, tedy 0.2.
  • Vytvoř instanci DecisionTreeRegressor() s názvem reg_dt a nastav tyto hyperparametry: min_samples_leaf = 3 a min_samples_split = 9.
  • Natrénuj regresor na trénovací sadě pomocí .fit().
  • Předpověz štítky testovací sady pomocí .predict().