1. Nauka
  2. /
  3. Kursy
  4. /
  5. Maszyny wektorów nośnych w R

Connected

ćwiczenie

Tworzenie zbiorów treningowego i testowego

Podział zbioru danych na zbiór treningowy i testowy to ważny krok podczas budowania i oceny modelu klasyfikacyjnego. Zbiór treningowy służy do zbudowania modelu, a zbiór testowy – do oceny jego dokładności predykcyjnej.

W tym ćwiczeniu podzielisz zbiór danych utworzony w poprzednim rozdziale na zbiór treningowy i testowy. Zbiór danych został wczytany do ramki danych df, a ziarno losowości zostało już ustawione, aby zapewnić odtwarzalność wyników. Przypomnij sobie, że w poprzednim filmie wyznaczyliśmy górną granicę rozmiaru zbioru treningowego za pomocą kilku przydatnych funkcji – teraz czas, żebyś zrobił to samodzielnie!

Instrukcje

100 XP
  • Wyznacz górną granicę liczby wierszy w zbiorze treningowym i zapisz ją w zmiennej sample_size.
  • Utwórz wektor train, w którym zostaną zapisane losowo przypisane obserwacje zbioru treningowego zgodnie z proporcją 80/20.
  • Przypisz wiersze z wektora train do ramki danych trainset, a pozostałe – do ramki danych testset.