1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Khai thác đặc trưng cho NLP bằng Python

Connected

Bài tập

Độ dễ đọc của các ấn phẩm khác nhau

Trong bài tập này, bạn được cung cấp các đoạn trích từ bài viết của bốn ấn phẩm. Nhiệm vụ của bạn là tính độ dễ đọc của các đoạn này bằng điểm Gunning fog và từ đó xác định mức độ khó/dễ tương đối khi đọc các ấn phẩm này.

Các đoạn trích có sẵn dưới dạng các chuỗi sau:

  • forbes - Đoạn trích từ một bài báo của tạp chí Forbes về hệ thống điểm tín nhiệm xã hội ở Trung Quốc.
  • harvard_law - Đoạn trích từ một bài điểm sách đăng trên Harvard Law Review.
  • r_digest - Đoạn trích từ một bài viết trên Reader's Digest về nhiễu động không khí khi bay.
  • time_kids - Đoạn trích từ một bài viết về tác hại của việc tiêu thụ muối đăng trên TIME for Kids.

Hướng dẫn

100 XP
  • Import lớp Readability từ readability.
  • Tính đối tượng gf cho mỗi excerpt bằng phương thức gunning_fog() trên Readability.
  • Tính điểm Gunning fog bằng thuộc tính score.
  • In danh sách các điểm Gunning fog.