1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie danych w Tidyverse

Connected

ćwiczenie

Dopasowanie modelu do danych treningowych

Czas podzielić dane na zbiór treningowy – do dopasowania modelu – oraz oddzielny zbiór testowy – do oceny jego zdolności predykcyjnych. Zanim jednak dokonasz tego podziału, pobieramy 100% wierszy ze zbioru house_prices bez zwracania i przypisujemy wynik do house_prices_shuffled. Pozwala to „przetasować" wiersze, dzięki czemu zbiory treningowy i testowy będą losowo dobrane.

Instrukcje 1/2

undefined XP
    1
    2
  • Użyj funkcji slice(), aby przypisać do train pierwsze 10 000 wierszy ze zbioru house_prices_shuffled, a do test pozostałe wiersze (łącznie 21 613 wierszy).