1. 학습
  2. /
  3. 강의
  4. /
  5. spaCy로 배우는 자연어 처리

Connected

연습 문제

spaCy로 문장 분할하기

이번 연습에서는 문장 분할을 실습해 보겠습니다. NLP에서 문서(텍스트)를 문장 단위로 나누는 작업은 매우 유용한 기본 연산이에요. 예를 들어 개체명 인식처럼 더 복잡한 많은 NLP 작업의 첫 단계이기도 합니다. 또, 문장 수를 파악하면 텍스트가 제공하는 정보량에 대한 단서를 얻을 수도 있어요.

texts라는 리스트에 음식 리뷰 10개가 들어 있습니다.

en_core_web_sm 모델은 이미 nlp로 로드되어 있어요.

지침

100 XP
  • texts 리스트의 각 항목에 spaCy 모델을 실행해 모든 Doc 컨테이너로 이루어진 리스트 documents를 만드세요.
  • documents 리스트를 순회하면서 각 doc 컨테이너의 문장을 추출해 sentences라는 리스트에 추가하세요.
  • sentences 리스트를 사용해 각 doc 컨테이너의 문장 수를 세세요.