1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mạng nơ-ron hồi quy (RNN) cho Mô hình ngôn ngữ với Keras

Connected

Bài tập

Khám phá bộ dữ liệu 20 News Groups

Trong bài tập này, bạn sẽ được cung cấp một mẫu của bộ dữ liệu 20 News Groups thu được bằng hàm fetch_20newsgroups() từ sklearn.datasets, chỉ lọc ba lớp: sci.space, alt.atheism và soc.religion.christian.

Bộ dữ liệu được nạp vào biến news_dataset. Các thuộc tính của nó đã được in ra để bạn khám phá trên bảng điều khiển.

Để biết thêm chi tiết về cách dùng hàm này, xem tài liệu Sklearn.

Bạn sẽ tokenize văn bản và one-hot encode nhãn theo từng bước để hiểu quá trình biến đổi diễn ra như thế nào.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • In bài viết ví dụ có chỉ số 5 từ news_dataset.data.