1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Transformacje na zbiorze treningowym i testowym (I)

Do tej pory tworzyłeś skalery na podstawie kolumny, a następnie stosowałeś je do tych samych danych, na których były trenowane. W przypadku budowania modeli uczenia maszynowego zazwyczaj trenuje się je na danych historycznych (zbiorze treningowym), a następnie stosuje do nowych, niewidzianych danych (zbiorze testowym). W takich sytuacjach należy zadbać o to, aby to samo skalowanie było stosowane zarówno do danych treningowych, jak i testowych.
W praktyce oznacza to, że skaler dopasowujesz na zbiorze treningowym, a następnie używasz go do transformacji zbioru testowego. Nigdy nie dopasowuj skalera ponownie na zbiorze testowym.

W tym ćwiczeniu i następnym ramka danych so_numeric_df jest podzielona na zbiór treningowy (so_train_numeric) i testowy (so_test_numeric).

Instrukcje

100 XP
  • Utwórz instancję StandardScaler() i przypisz ją do zmiennej SS_scaler.
  • Dopasuj StandardScaler na kolumnie Age.
  • Zastosuj transformację na kolumnie Age w zbiorze testowym (so_test_numeric).