1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Bài tập

Thêm pipe trong spaCy

Bạn thường sử dụng một mô hình spaCy có sẵn cho nhiều tác vụ NLP khác nhau. Tuy nhiên, trong một số trường hợp, một thành phần pipeline có sẵn như phân đoạn câu có thể mất nhiều thời gian để cho ra kết quả như mong đợi. Trong bài tập này, bạn sẽ thực hành thêm một thành phần pipeline vào một mô hình spaCy (pipeline xử lý văn bản).

Bạn sẽ dùng năm đánh giá đầu tiên từ bộ dữ liệu Amazon Fine Food Reviews cho bài tập này. Bạn có thể truy cập các đánh giá này qua chuỗi texts.

Gói spaCy đã được nhập sẵn để bạn sử dụng.

Hướng dẫn

100 XP
  • Tải một mô hình tiếng Anh spaCy trống và thêm thành phần sentencizer vào mô hình.
  • Tạo một Doc cho texts, tạo một danh sách để lưu các sentences của tài liệu đã cho và in ra số lượng câu.
  • In danh sách token trong câu thứ hai từ danh sách sentences.