1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Natural Language Processing bằng Python

Connected

Bài tập

Nhiều regex hơn với re.search()

Trong bài tập này, bạn sẽ dùng re.search() và re.match() để tìm các token cụ thể. Cả search và match đều nhận vào các mẫu regex, tương tự như bạn đã định nghĩa ở bài trước. Bạn sẽ áp dụng các phương thức của thư viện regex này lên cùng đoạn văn Monty Python từ kho ngữ liệu nltk.

Bạn có sẵn scene_one và sentences từ bài trước; giờ hãy dùng chúng với re.search() và re.match() để trích xuất và khớp nhiều đoạn văn bản hơn.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Dùng re.search() để tìm lần xuất hiện đầu tiên của từ "coconuts" trong scene_one. Lưu kết quả vào match.
  • In ra chỉ số bắt đầu và kết thúc của match lần lượt bằng các phương thức .start() và .end() của nó.