1. Uczyć się
  2. /
  3. Courses
  4. /
  5. spaCy로 배우는 Advanced NLP

Connected

Exercise

학습 데이터 만들기 (1)

spaCy의 규칙 기반 Matcher는 개체명 인식 모델을 위한 학습 데이터를 빠르게 만드는 데 매우 유용해요. 문장 목록이 변수 TEXTS로 제공됩니다. IPython 셸에서 출력해 살펴볼 수 있어요. 우리는 다양한 iPhone 모델의 언급을 모두 찾아서, 모델이 이를 'GADGET'으로 인식하도록 가르칠 학습 데이터를 만들려고 합니다.

nlp 객체는 이미 생성되어 있고, Matcher는 변수 matcher로 제공됩니다.

Instrukcje

100 XP
  • 소문자 형태가 'iphone'과 'x'에 각각 매칭되는 두 토큰 패턴을 작성하세요.
  • 두 토큰 패턴을 작성하세요: 첫 번째는 소문자 형태가 'iphone'에 매칭되는 토큰, 두 번째는 '?' 연산자를 사용한 선택적 숫자 토큰입니다.