1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Deep Learning cho Văn bản với PyTorch

Connected

Bài tập

Xây dựng mô hình RNN cho văn bản

Là một nhà phân tích dữ liệu tại PyBooks, bạn thường gặp các tập dữ liệu có thông tin tuần tự, như tương tác của khách hàng, dữ liệu chuỗi thời gian hoặc tài liệu văn bản. RNN có thể phân tích hiệu quả và rút ra insight từ những dữ liệu như vậy. Trong bài tập này, bạn sẽ làm việc với bộ dữ liệu Newsgroup đã được xử lý và mã hóa sẵn. Bộ dữ liệu này gồm các bài viết từ nhiều chủ đề khác nhau. Nhiệm vụ của bạn là áp dụng RNN để phân loại các bài viết vào ba nhóm:

rec.autos, sci.med, và comp.graphics.

Những mục sau đã được nạp sẵn cho bạn: torch, nn, optim.

Ngoài ra, các tham số input_size, hidden_size (32), num_layers (2), và num_classes cũng đã được nạp sẵn.

Bài này và các bài tiếp theo sử dụng bộ dữ liệu fetch_20newsgroups từ sklearn.

Hướng dẫn

100 XP
  • Hoàn thiện lớp RNN với một lớp RNN và một lớp fully connected (Linear).
  • Khởi tạo mô hình.
  • Huấn luyện mô hình RNN trong mười epoch bằng cách đưa gradient về 0 mỗi vòng.