1. 학습
  2. /
  3. 강의
  4. /
  5. spaCy로 배우는 자연어 처리

Connected

연습 문제

spaCy에서 파이프 추가하기

여러분은 다양한 NLP 작업에 기존 spaCy 모델을 자주 사용해요. 하지만 경우에 따라 문장 분할 같은 기성 파이프라인 컴포넌트가 기대한 결과를 내는 데 시간이 오래 걸릴 수 있어요. 이번 연습에서는 spaCy 모델(텍스트 처리 파이프라인)에 파이프라인 컴포넌트를 추가하는 방법을 연습해 보겠습니다.

이 연습에서는 Amazon Fine Food Reviews 데이터셋에서 처음 다섯 개 리뷰를 사용해요. texts 문자열을 통해 이 리뷰들에 접근할 수 있어요.

spaCy 패키지는 이미 임포트되어 있어 바로 사용할 수 있습니다.

지침

100 XP
  • 빈 spaCy 영어 모델을 로드하고, 모델에 sentencizer 컴포넌트를 추가하세요.
  • texts에 대한 Doc 컨테이너를 만들고, 주어진 문서의 sentences를 저장할 리스트를 만든 다음 문장 개수를 출력하세요.
  • sentences 리스트에서 두 번째 문장의 토큰 리스트를 출력하세요.