1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie z tidymodels w R

Connected

ćwiczenie

Tworzenie zbiorów treningowego i testowego

Pakiet rsample służy do tworzenia zbiorów treningowych i testowych. Wydzielenie zbioru testowego jest ważne, ponieważ pozwala ocenić, jak wytrenowany model poradzi sobie z nowymi danymi. Chroni też przed przeuczeniem – sytuacją, w której model zapamiętuje wzorce obecne wyłącznie w danych treningowych i słabo generalizuje na nowe przypadki.

W tym ćwiczeniu utworzysz zbiory treningowy i testowy na podstawie danych home_sales. Zbiór zawiera informacje o domach sprzedanych w rejonie Seattle w stanie Waszyngton w latach 2015–2016.

Zmienna wynikowa w tych danych to selling_price.

Pakiet tidymodels będzie wczytany automatycznie w każdym ćwiczeniu kursu. Tibble home_sales również jest już dostępny.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Utwórz obiekt rsample o nazwie home_split, który zawiera instrukcje losowego podziału danych home_sales na zbiór treningowy i testowy.
  • Przydziel 70% danych do zbioru treningowego i zastosuj stratyfikację według zmiennej selling_price.