출력 텍스트 준비하기

이 연습 문제에서는 번역 모델에 사용할 출력 텍스트를 준비해 보겠습니다. 텍스트를 인덱스 시퀀스로 변환하는 것 외에도, 각 인덱스를 원-핫 인코딩해야 해요.

영어 텍스트는 en_sentences 변수에, 학습된 토크나이저는 output_tokenizer 변수에, 영어 어휘 크기는 en_vocab_size 변수에 로드되어 있습니다.

또한 출력 언어를 변환하는 초기 단계(텍스트를 인덱스 시퀀스로 변환)를 수행하는 함수가 이미 만들어져 있어요. 이 함수는 transform_text_to_sequences() 이름으로 환경에 로드되어 있으며, 두 개의 매개변수를 받습니다. sentences는 영어 문장 리스트를, tokenizer는 keras.preprocessing.text 모듈의 학습된 Tokenizer 객체를 기대합니다.