1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în Python

Connected

exercițiu

Împărțirea în set de antrenament și set de testare

În acest capitol, vei continua să lucrezi cu setul de date ANSUR. Înainte de a construi un model pe datele tale, trebuie să decizi ce caracteristică vrei să prezici. În acest caz, scopul este să prezici genul.

Va trebui să extragi coloana care conține această caracteristică din setul de date, apoi să împarți datele într-un set de antrenament și un set de testare. Setul de antrenament va fi folosit pentru a antrena modelul, iar setul de testare va fi folosit pentru a-i evalua performanța pe date nevăzute.

ansur_df a fost deja încărcat pentru tine.

Instrucțiuni

100 XP
  • Importă funcția train_test_split din sklearn.model_selection.
  • Atribuie coloana 'Gender' variabilei y.
  • Elimină coloana 'Gender' din DataFrame și atribuie rezultatul variabilei X.
  • Setează dimensiunea setului de testare la 30%, pentru o împărțire de 70% antrenament și 30% testare.