1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Khai thác đặc trưng cho NLP bằng Python

Connected

Bài tập

Nhận diện người được nhắc đến trong một bài báo

Trong bài tập này, bạn được cung cấp một đoạn trích từ một bài báo đăng trên TechCrunch. Nhiệm vụ của bạn là viết hàm find_people để nhận diện tên những người được nhắc đến trong một đoạn văn bản. Sau đó, bạn sẽ dùng find_people để tìm các nhân vật quan trọng trong bài báo.

Bài báo có sẵn dưới dạng chuỗi tc và đã được in ra console. Mô hình spaCy cần thiết cũng đã được nạp sẵn dưới tên nlp.

Hướng dẫn

100 XP
  • Tạo một đối tượng Doc cho text.
  • Dùng list comprehension, lặp qua doc.ents và tạo một danh sách các thực thể được đặt tên có nhãn là PERSON.
  • Dùng find_persons() để in ra những người được nhắc đến trong tc.