Wypróbuj podział 80/20

Skoro zbiór danych jest już losowo posortowany, możesz podzielić go na dwie części: pierwsze 80% wierszy trafi do zbioru treningowego, a ostatnie 20% – do zbioru testowego. Wystarczy wyznaczyć punkt podziału mniej więcej w 80% długości zbioru danych:

split <- round(nrow(mydata) * 0.80)

Następnie użyj tego punktu, aby wyodrębnić pierwsze 80% danych jako zbiór treningowy:

mydata[1:split, ]

Ten sam punkt posłuży do wyznaczenia zbioru testowego:

mydata[(split + 1):nrow(mydata), ]

Wyznacz indeks wiersza, który wyznaczy punkt podziału mniej więcej w 80% zbioru danych diamonds. Nazwij ten indeks split.
Utwórz zbiór treningowy o nazwie train, korzystając z tego indeksu.
Utwórz zbiór testowy o nazwie test, korzystając z tego indeksu.

ćwiczenie

Wypróbuj podział 80/20

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie