Transformarea datelor nevăzute

Când creezi vectori din text, orice transformări aplicate înainte de antrenarea unui model de machine learning trebuie aplicate și asupra datelor noi, nevăzute (de testare). Pentru a realiza acest lucru, urmează aceeași abordare din capitolul anterior: antrenează vectorizatorul doar pe datele de antrenament și aplică-l pe datele de testare.

Pentru acest exercițiu, DataFrame-ul speech_df a fost împărțit în două: