LSTM으로 텍스트 예측하기

이 연습 문제에서는 작은 텍스트 데이터셋을 사용해 다음 단어를 예측하는 간단한 LSTM 모델을 만들어 볼 거예요. 이 데이터셋은 The Lord of the Ring 영화의 정제된 대사로 구성되어 있으며, text 변수에 담겨 있어요.

이 text를 길이 4의 sequences로 변환하고, Keras의 Tokenizer를 사용해 모델에 들어갈 특성과 레이블을 준비해 보세요!

Keras의 Tokenizer는 이미 임포트되어 있어 바로 사용할 수 있어요. 이 도구는 각 고유 단어에 고유한 숫자를 할당하고 그 매핑을 딕셔너리에 저장합니다. 모델은 숫자를 다루기 때문에 중요하며, 나중에 예측 결과 숫자를 다시 단어로 디코딩할 때도 필요해요.