1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z modelami drzewiastymi w R

Connected

ćwiczenie

Tworzenie podziałów

Jednokrotny podział danych na zbiór treningowy i testowy ma pewną słabość statystyczną – istnieje ryzyko, że zbiór testowy trafi na same wysoko oceniane ziarna kakao, a wszystkie nisko oceniane trafią do zbioru treningowego. Oznacza to też, że wydajność modelu możesz zmierzyć tylko raz.

Walidacja krzyżowa pozwala uzyskać bardziej rzetelną ocenę skuteczności modelu na nowych danych – bez tych statystycznych pułapek. Dzięki niej model jest oceniany gruntowniej.

W tym ćwiczeniu stworzysz podziały zbioru treningowego chocolate_train, który jest już wczytany.

Instrukcje

100 XP
  • Ustaw ziarno losowości na 20, aby zapewnić odtwarzalność wyników.
  • Utwórz 10 podziałów zbioru chocolate_train i zapisz wynik jako chocolate_folds.