1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning s balíčkem caret v R

Connected

cvičení

Předpovědi na testovací sadě

Teď, když máš náhodně rozdělenou trénovací a testovací sadu, můžeš použít funkci lm() – stejně jako v prvním cvičení – a natrénovat model na trénovací sadě místo na celém datasetu. Připomeň si, že pomocí formulového rozhraní funkce pro lineární regresi můžeš natrénovat model se zadanou cílovou proměnnou a všemi ostatními proměnnými v datasetu jako prediktory:

mod <- lm(y ~ ., training_data)

K vytvoření předpovědí z tohoto modelu na nových datech slouží funkce predict(). Nový dataset musí obsahovat všechny sloupce z trénovacích dat, ale mohou být v jiném pořadí a s různými hodnotami. Místo opakovaného předpovídání na trénovací sadě teď provedeš předpovědi na testovací sadě, kterou jsi při trénování modelu nepoužil/a. To ti v dalším cvičení umožní zjistit chybu modelu na nových datech:

p <- predict(model, new_data)

Pokyny

100 XP
  • Natrénuj model lm() s názvem model, který bude předpovídat price s využitím všech ostatních proměnných jako kovariát. Nezapomeň použít trénovací sadu train.
  • Proveď předpovědi na testovací sadě test pomocí funkce predict(). Výsledné hodnoty ulož do vektoru s názvem p.