1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Natural Language Processing bằng Python

Connected

Bài tập

Nhận diện thực thể tiếng Tây Ban Nha với polyglot

Bạn sẽ tiếp tục khám phá polyglot với phần gán nhãn tiếng Tây Ban Nha. Bài viết này không phải của một tờ báo, nên đây là ví dụ đầu tiên có phong cách giống blog hơn. Theo bạn, điều đó sẽ ảnh hưởng thế nào khi tìm thực thể?

Đối tượng Text đã được tạo là txt, và mỗi thực thể đã được in ra, như bạn thấy trong IPython Shell.

Nhiệm vụ cụ thể của bạn là xác định có bao nhiêu thực thể chứa từ "Márquez" hoặc "Gabo" - đây đều là những cách gọi cùng một người!

Hướng dẫn

100 XP
  • Lặp qua tất cả các thực thể của txt, dùng ent làm biến lặp.
  • Kiểm tra xem thực thể có chứa "Márquez" hoặc "Gabo" không. Nếu có, hãy tăng count. Đừng quên ký tự có dấu á trong "Márquez"!
  • Nhấn "Gửi câu trả lời" để xem bao nhiêu phần trăm thực thể đề cập đến Gabriel García Márquez (còn gọi là Gabo).