Przewidywanie na zbiorze testowym

Masz już losowo podzielone dane na zbiór treningowy i testowy – teraz możesz użyć funkcji lm() (tak jak w pierwszym ćwiczeniu), aby dopasować model do zbioru treningowego, a nie do całego zbioru danych. Przypomnij sobie, że interfejs formuły funkcji regresji liniowej pozwala dopasować model z określoną zmienną docelową, używając wszystkich pozostałych zmiennych jako predyktorów:

mod <- lm(y ~ ., training_data)

Funkcja predict() umożliwia generowanie prognoz z tego modelu na nowych danych. Nowy zbiór danych musi zawierać wszystkie kolumny ze zbioru treningowego, choć mogą być w innej kolejności i mieć różne wartości. Zamiast ponownie przewidywać na zbiorze treningowym, możesz teraz użyć zbioru testowego, który nie brał udziału w trenowaniu modelu. Pozwoli ci to wyznaczyć błąd na danych spoza próby treningowej w kolejnym ćwiczeniu:

p <- predict(model, new_data)

Dopasuj model lm() o nazwie model, który przewiduje price na podstawie wszystkich pozostałych zmiennych jako predyktorów. Pamiętaj, żeby użyć zbioru treningowego train.
Wygeneruj prognozy na zbiorze testowym test przy użyciu funkcji predict(). Zapisz wyniki w wektorze o nazwie p.

ćwiczenie

Przewidywanie na zbiorze testowym

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie