1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning in R: Regression

Connected

Cvičení

vtreat pro data o půjčování kol

V tomto cvičení vytvoříš one-hot-enkódované datové rámce z dat o půjčování kol za červenec a srpen, které pak použiješ s xgboost.

Dataové rámce bikesJuly a bikesAugust jsou již načteny.

Pro usnadnění práce je proměnná vars předem definována se seznamem sloupců proměnných pro model.

Pokyny

100 XP
  • Načti balíček vtreat.
  • Pomocí designTreatmentsZ() vytvoř plán úprav treatplan pro proměnné v vars z datového rámce bikesJuly (trénovací data).
    • Nastav příznak verbose=FALSE, aby funkce nevypisovala příliš mnoho zpráv.
  • Doplň chybějící části a vytvoř vektor newvars obsahující pouze názvy transformovaných proměnných typu clean a lev. Vypiš ho.
  • Pomocí prepare() vytvoř one-hot-enkódovaný trénovací datový rámec bikesJuly.treat.
    • Pomocí argumentu varRestrictions omez použité proměnné na ty v newvars.
  • Stejným způsobem vytvoř pomocí prepare() one-hot-enkódovaný testovací rámec bikesAugust.treat z datového rámce bikesAugust.
  • Zavolej str() na oba připravené datové rámce a prohlédni si jejich strukturu.