1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. spaCy로 배우는 Advanced NLP

Connected

अभ्यास

효율적인 구문 매칭

토큰을 하나하나 설명하는 패턴을 작성하는 대신, 정확한 문자열을 직접 매칭하는 편이 더 효율적일 때가 있어요. 전 세계 국가처럼 유한한 범주의 항목에는 특히 그렇습니다.

이미 국가 목록이 있으니, 이를 정보 추출 스크립트의 기반으로 사용해 볼게요. 문자열 이름 목록은 변수 COUNTRIES로 제공됩니다. nlp 객체와 테스트용 doc은 이미 생성되어 있고, doc.text는 셸에 출력해 두었어요.

निर्देश

100 XP
  • PhraseMatcher를 임포트하고, 공유된 vocab으로 초기화하여 변수 matcher에 저장하세요.
  • 구문 패턴을 추가하고, doc에 대해 매처를 실행하세요.