未知データの変換

テキストからベクトルを作成する際、Machine Learningモデルを学習させる前に行ったあらゆる前処理は、新しい未知（テスト）データにも同様に適用する必要があります。これを実現するには前章と同じ方針、すなわち「ベクトライザは学習データに対してのみfitし、テストデータにはそれを適用する」ことを守ってください。

この演習では speech_df DataFrame を次の2つに分割しています。