1. 학습
  2. /
  3. 강의
  4. /
  5. PyTorch로 배우는 텍스트 딥러닝

Connected

연습 문제

책 제목에 대한 Bag-of-Words

PyBooks에는 이제 추가 분석을 위해 인코딩해야 하는 책 제목 목록이 있어요. 데이터 팀은 Bag of Words(BoW) 모델이 가장 적합한 접근일 수 있다고 보고 있어요.

다음 패키지가 이미 임포트되어 있어요: torch, torchtext.

지침

100 XP
  • bag-of-words를 구현하기 위해 CountVectorizer 클래스를 임포트하세요.
  • 임포트한 클래스의 객체를 초기화한 뒤, 이 객체를 사용해 titles를 행렬 표현으로 변환하세요.
  • get_feature_names_out() 메서드를 사용해 처음 다섯 개의 피처 이름과 인코딩된 제목을 추출해 표시하세요.