1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Transformowanie nowych danych

Podczas tworzenia wektorów z tekstu wszystkie przekształcenia zastosowane przed trenowaniem modelu uczenia maszynowego trzeba również zastosować na nowych, niewidzianych wcześniej danych testowych. Postępuj tak samo jak w poprzednim rozdziale: dopasuj wektoryzer tylko na danych treningowych, a następnie zastosuj go na danych testowych.

Na potrzeby tego ćwiczenia ramka danych speech_df została podzielona na dwie części:

  • train_speech_df: zbiór treningowy złożony z pierwszych 45 przemówień.
  • test_speech_df: zbiór testowy złożony z pozostałych przemówień.

Instrukcje

100 XP
  • Utwórz instancję TfidfVectorizer.
  • Dopasuj wektoryzer i zastosuj go na kolumnie text_clean.
  • Zastosuj ten sam wektoryzer na kolumnie text_clean danych testowych.
  • Utwórz ramkę danych z nowych cech uzyskanych ze zbioru testowego.