1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Redukcja wymiarowości w Pythonie

Connected

Bài tập

Podział na zbiór treningowy i testowy

W tym rozdziale będziesz nadal pracować ze zbiorem danych ANSUR. Zanim zbudujesz model na swoich danych, musisz najpierw zdecydować, którą cechę chcesz przewidywać. W tym przypadku celem jest przewidywanie płci.

Należy wyodrębnić kolumnę zawierającą tę cechę ze zbioru danych, a następnie podzielić dane na zbiór treningowy i testowy. Zbiór treningowy posłuży do nauczenia modelu, a zbiór testowy – do sprawdzenia jego działania na nowych danych.

ansur_df zostało wcześniej wczytane.

Hướng dẫn

100 XP
  • Zaimportuj funkcję train_test_split z modułu sklearn.model_selection.
  • Przypisz kolumnę 'Gender' do zmiennej y.
  • Usuń kolumnę 'Gender' z ramki danych i przypisz wynik do zmiennej X.
  • Ustaw rozmiar zbioru testowego na 30%, aby uzyskać podział 70% treningowych i 30% testowych.