1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z caret w R

Connected

ćwiczenie

Przewidywanie na zbiorze testowym

Masz już losowo podzielone dane na zbiór treningowy i testowy – teraz możesz użyć funkcji lm() (tak jak w pierwszym ćwiczeniu), aby dopasować model do zbioru treningowego, a nie do całego zbioru danych. Przypomnij sobie, że interfejs formuły funkcji regresji liniowej pozwala dopasować model z określoną zmienną docelową, używając wszystkich pozostałych zmiennych jako predyktorów:

mod <- lm(y ~ ., training_data)

Funkcja predict() umożliwia generowanie prognoz z tego modelu na nowych danych. Nowy zbiór danych musi zawierać wszystkie kolumny ze zbioru treningowego, choć mogą być w innej kolejności i mieć różne wartości. Zamiast ponownie przewidywać na zbiorze treningowym, możesz teraz użyć zbioru testowego, który nie brał udziału w trenowaniu modelu. Pozwoli ci to wyznaczyć błąd na danych spoza próby treningowej w kolejnym ćwiczeniu:

p <- predict(model, new_data)

Instrukcje

100 XP
  • Dopasuj model lm() o nazwie model, który przewiduje price na podstawie wszystkich pozostałych zmiennych jako predyktorów. Pamiętaj, żeby użyć zbioru treningowego train.
  • Wygeneruj prognozy na zbiorze testowym test przy użyciu funkcji predict(). Zapisz wyniki w wektorze o nazwie p.