1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z modelami drzewiastymi w R

Connected

ćwiczenie

Podział na zbiór treningowy i testowy

Aby przetestować swoje modele, musisz zbudować je i ocenić na dwóch różnych częściach danych – inaczej to jak ściąganie na egzaminie (skoro znasz już odpowiedzi).

Podział danych to nieodłączny etap procesu modelowania. Zaczniesz od podziału zbioru danych dotyczących cukrzycy i sprawdzenia proporcji tego podziału.

Dane diabetes z poprzedniego ćwiczenia są już wczytane do twojego środowiska pracy.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Podziel tibble diabetes na obiekt diabetes_split, przeznaczając 80% danych do zbioru treningowego i 20% do zbioru testowego.
  • Wyświetl otrzymany obiekt.