1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning in R: Regression

Connected

Cvičení

Natrénuj model xgboost pro půjčovnu kol a proveď predikci

V tomto cvičení natrénuješ model gradient boosting pomocí funkce xgboost(), abys předpověděl/a počet vypůjčených kol za hodinu v závislosti na počasí, typu dne a denní době. Model natrénuješ na datech z července a predikci provedeš na datech z srpna.

Dataové rámce bikesJuly, bikesJuly.treat, bikesAugust a bikesAugust.treat jsou předem načteny. Nezapomeň, že data zpracovaná pomocí vtreat již neobsahují sloupec s výstupní proměnnou – ten musíš získat z původních dat (sloupec cnt).

Pro usnadnění práce je k dispozici také proměnná ntrees z předchozího cvičení, která udává počet stromů.

Argumenty funkce xgboost() (docs) jsou podobné jako u funkce xgb.cv().

Pokyny

100 XP
  • Doplň chybějící části kódu a spusť funkci xgboost() na červencových datech.
    • Pomocí as.matrix() převeď datový rámec zpracovaný přes vtreat na matici.
    • Jako objective použij "reg:squarederror".
    • Nastav počet rund na ntrees.
    • Nastav eta na 0.75, max_depth na 5 a verbose na FALSE (tichý režim).
  • Zavolej funkci predict() na bikesAugust.treat a předpověz počet půjčených kol v srpnu.
    • Pomocí as.matrix() převeď testovací data zpracovaná přes vtreat na matici.
    • Přidej predikce do bikesAugust jako sloupec pred.
  • Doplň chybějící části kódu a vykresli graf skutečných počtů půjčených kol oproti predikcím (predikce na ose x).
    • Všimneš si nějakého možného problému s predikcemi?