1. 학습
  2. /
  3. 강의
  4. /
  5. Keras로 배우는 언어 모델링을 위한 순환 신경망(RNN)

Connected

연습 문제

데이터 전처리

이제 다중 클래스 분류에서 데이터를 전처리하는 방법의 차이를 배웠어요. 간단한 다중 클래스 분류 모델을 만들기 전에, 전처리를 직접 해 보겠습니다.

데이터셋은 변수 news_dataset에 로드되어 있으며, 다음 속성을 가집니다:

  • news_dataset.data: 텍스트 배열
  • news_dataset.target: 숫자 인덱스로 표현한 타깃 범주 배열

샘플 데이터에는 5,000개의 관측치가 있습니다.

지침

100 XP
  • tokenizer 변수에 Tokenizer 클래스를 인스턴스화하세요.
  • 텍스트 데이터에 tokenizer를 학습(fit)하세요.
  • 텍스트 데이터에 .texts_to_sequences() 메서드를 사용하세요.
  • 타깃 인덱스를 준비하기 위해 to_categorical() 함수를 사용하세요.