1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în R

Connected

exercițiu

Împarte datele în seturi de antrenament și de testare

Primul pas în antrenarea unui model este împărțirea datelor în seturi de antrenament și de testare. Pachetul tidymodels simplifică acest proces. Separarea unui set de testare îți permite să evaluezi modelul antrenat pe date pe care acesta nu le-a văzut până atunci.

Vei folosi datele privind fluctuația angajaților dintr-o companie din domeniul sănătății, care conțin informații despre angajați și dacă aceștia au părăsit sau nu compania. Setul de date este disponibil în attrition_df. Variabila țintă este Attrition.

Pachetele tidyverse și tidymodels au fost deja încărcate pentru tine.

Instrucțiuni

100 XP
  • Inițializează o împărțire a datelor cu 80% pentru antrenament și stratifică în funcție de Attrition, variabila țintă.
  • Extrage setul de antrenament și stochează-l în train.
  • Extrage setul de testare și stochează-l în test.