Tách theo ngữ nghĩa

Tất cả các chiến lược tách mà bạn đã dùng đến giờ đều có cùng một điểm yếu: việc tách không xét ngữ cảnh xung quanh, nên ngữ cảnh rất dễ bị mất trong quá trình tách.

Trong bài tập này, bạn sẽ tạo và áp dụng một bộ tách văn bản theo ngữ nghĩa, một phương pháp thử nghiệm tiên tiến để tách văn bản dựa trên ý nghĩa ngữ nghĩa. Khi bộ tách phát hiện ý nghĩa của văn bản lệch quá một ngưỡng nhất định, nó sẽ thực hiện việc tách.