1. Learn
  2. /
  3. Courses
  4. /
  5. Xử lý ngôn ngữ tự nhiên với spaCy

Connected

Exercise

Chạy một pipeline spaCy

Bạn đã chạy pipeline NLP của spaCy trên một đoạn văn bản đơn lẻ và cũng đã trích xuất các token từ một danh sách các container Doc. Trong bài tập này, bạn sẽ luyện tập các bước khởi đầu khi chạy pipeline spaCy trên texts, là một danh sách các chuỗi văn bản.

Bạn sẽ dùng model en_core_web_sm cho mục đích này. Gói spaCy đã được nhập sẵn cho bạn.

Instructions

100 XP
  • Nạp model en_core_web_sm thành nlp.
  • Chạy mô hình nlp() trên từng phần tử của texts, và thêm mỗi Doc tương ứng vào danh sách documents.
  • In ra văn bản của các token cho mỗi container Doc trong danh sách documents.