1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 챗봇 만들기

Connected

연습 문제

spaCy의 엔터티 인식기 사용하기

이 연습 문제에서는 spaCy의 내장 엔터티 인식기를 사용해 검색 쿼리에서 사람 이름, 날짜, 그리고 조직명을 추출해 보겠습니다. spaCy 라이브러리는 이미 임포트되어 있고, 영어 모델은 nlp로 로드되어 있어요.

여러분의 할 일은 extract_entities()라는 함수를 정의하는 것입니다. 이 함수는 하나의 인수 message를 받아, 포함할 엔터티 유형을 키로 하고 추출된 엔터티를 값으로 하는 딕셔너리를 반환해야 합니다. 포함할 엔터티 유형은 include_entities라는 리스트에 들어 있습니다.

지침

100 XP
  • dict.fromkeys()에 include_entities만 인수로 전달해 엔터티를 담을 딕셔너리 ents를 만드세요.
  • message를 nlp 객체에 전달해 spacy 문서 doc을 생성하세요.
  • 문서의 엔터티들(doc.ents)을 순회하세요.
  • 해당 엔터티의 .label_이 우리가 관심 있는 유형인지 확인하세요. 맞다면 그 엔터티의 .text 속성을 ents 딕셔너리의 해당 키에 할당하세요.