1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie z tidymodels w R

Connected

ćwiczenie

Rozkład wartości zmiennej wynikowej

Stratyfikacja według zmiennej wynikowej podczas tworzenia zbiorów treningowego i testowego zapewnia, że wartości tej zmiennej mają podobny zakres w obu zbiorach.

Ponieważ dane są dzielone losowo, stratyfikacja pozwala uniknąć sytuacji, w której wszystkie drogie domy ze zbioru home_sales trafiłyby np. wyłącznie do zbioru testowego. W takim przypadku model najprawdopodobniej działałby słabo, ponieważ był trenowany na tańszych nieruchomościach.

W tym ćwiczeniu obliczysz statystyki opisowe dla zmiennej selling_price w zbiorach treningowym i testowym. Ramki danych home_training oraz home_test zostały wczytane z poprzedniego ćwiczenia.

Instrukcje 1/2

undefined XP
  • 1
    • Oblicz wartość minimalną, maksymalną, średnią i odchylenie standardowe zmiennej selling_price w zbiorze home_training.
  • 2
    • Oblicz wartość minimalną, maksymalną, średnią i odchylenie standardowe zmiennej selling_price w zbiorze home_test.