1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z caret w R

Connected

ćwiczenie

Wypróbuj podział 80/20

Skoro zbiór danych jest już losowo posortowany, możesz podzielić go na dwie części: pierwsze 80% wierszy trafi do zbioru treningowego, a ostatnie 20% – do zbioru testowego. Wystarczy wyznaczyć punkt podziału mniej więcej w 80% długości zbioru danych:

split <- round(nrow(mydata) * 0.80)

Następnie użyj tego punktu, aby wyodrębnić pierwsze 80% danych jako zbiór treningowy:

mydata[1:split, ]

Ten sam punkt posłuży do wyznaczenia zbioru testowego:

mydata[(split + 1):nrow(mydata), ]

Instrukcje

100 XP
  • Wyznacz indeks wiersza, który wyznaczy punkt podziału mniej więcej w 80% zbioru danych diamonds. Nazwij ten indeks split.
  • Utwórz zbiór treningowy o nazwie train, korzystając z tego indeksu.
  • Utwórz zbiór testowy o nazwie test, korzystając z tego indeksu.