1. 학습
  2. /
  3. 강의
  4. /
  5. spaCy로 배우는 자연어 처리

Connected

연습 문제

spaCy 모델을 처음부터 학습하기

spaCy는 직접 모델을 학습하기 위한 매우 간결하고 효율적인 방법을 제공합니다. 이 연습 문제에서는 실제 코퍼스(CORD-19 데이터)로 NER 모델을 처음부터 학습해 보겠습니다.

학습 데이터는 올바른 형식의 training_data로 제공됩니다. 이 연습 문제에서는 빈 영어 모델(nlp)에 NER 컴포넌트를 추가하고, labels에 저장된 레이블(“Pathogen”, “MedicalCondition”, “Medicine”) 목록을 사용합니다. 의료 도메인의 해당 labels를 NER 파이프라인에 추가한 뒤, 모델을 한 에포크(epoch) 동안 학습하세요. 필요한 형식으로 학습 데이터를 변환하기 위해 미리 임포트된 Example 클래스를 사용할 수 있습니다. 모델 학습 과정을 추적하려면 .update() 메서드에 losses 딕셔너리를 전달하고 학습 손실을 확인하세요.

지침

100 XP
  • 빈 spaCy 모델을 만들고 NER 컴포넌트를 모델에 추가하세요.
  • 다른 파이프라인 컴포넌트는 비활성화하고, 생성한 optimizer 객체를 사용해 Example 형식으로 변환한 데이터를 이용하여 모델 가중치를 업데이트하세요.