1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Khai thác đặc trưng cho NLP bằng Python

Connected

Bài tập

Đếm danh từ trong một đoạn văn bản

Trong bài tập này, bạn sẽ viết hai hàm, nouns() và proper_nouns(), để lần lượt đếm số lượng danh từ thường và danh từ riêng trong một đoạn văn bản.

Các hàm này sẽ nhận vào một đoạn văn bản và tạo ra một danh sách chứa các thẻ POS cho từng từ. Sau đó, hàm sẽ trả về số lượng danh từ riêng/danh từ thường mà văn bản chứa. Ở bài tập tiếp theo, chúng ta sẽ dùng các hàm này để rút ra những insight thú vị về tin giả.

Mô hình en_core_web_sm đã được nạp sẵn là nlp trong bài tập này.

Hướng dẫn 1/2

undefined XP
  • 1

    Dùng phương thức count của list để đếm số lượng danh từ riêng (được gán nhãn PROPN) trong danh sách pos.

  • 2

    Dùng phương thức count của list để đếm số lượng danh từ thường (được gán nhãn NOUN) trong danh sách pos.