1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. NLP nâng cao với spaCy

Connected

Bài tập

Xử lý dữ liệu có ngữ cảnh

Trong bài tập này, bạn sẽ dùng các thuộc tính mở rộng (custom attributes) để thêm thông tin meta về tác giả và cuốn sách cho các trích dẫn.

Một danh sách các ví dụ (text, context) đã có sẵn trong biến DATA. Các text là trích dẫn từ những cuốn sách nổi tiếng, còn context là các từ điển có khóa 'author' và 'book'. Đối tượng nlp đã được tạo sẵn cho bạn.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Import lớp Doc và dùng phương thức set_extension để đăng ký các thuộc tính mở rộng 'author' và 'book', với giá trị mặc định là None.