1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w tidyverse

Connected

ćwiczenie

Ramki danych do walidacji krzyżowej

Masz już wydzieloną część danych jako dane testowe – teraz możesz wykorzystać pozostałą część do znalezienia najlepszego modelu.

W tym ćwiczeniu podzielisz dane treningowe na serię 5 zestawów treningowo-walidacyjnych, korzystając z funkcji vfold_cv() z pakietu rsample.

Instrukcje

100 XP
  • Na podstawie training_data zbuduj ramkę danych do 5-krotnej walidacji krzyżowej, używając vfold_cv(), i przypisz wynik do cv_split.
  • Przygotuj cv_data, dodając do cv_split dwie nowe kolumny:
    • train: zawierającą treningowe ramki danych, uzyskane przez zmapowanie training() po kolumnie splits.
    • validate: zawierającą walidacyjne ramki danych, uzyskane przez zmapowanie testing() po kolumnie splits.