1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Deep Learning cho Văn bản với PyTorch

Connected

Bài tập

Dịch ngôn ngữ với mô hình PyTorch pretrained

Đội của bạn tại PyBooks đang phát triển một dự án AI liên quan đến dịch từ ngôn ngữ này sang ngôn ngữ khác. Họ muốn tận dụng các mô hình đã được huấn luyện sẵn để tiết kiệm nhiều thời gian và tài nguyên. Nhiệm vụ trong bài tập này là thiết lập một mô hình dịch từ thư viện Transformers của HuggingFace, cụ thể là mô hình T5 (Text-To-Text Transfer Transformer), và dùng nó để dịch một câu tiếng Anh sang tiếng Pháp.

T5Tokenizer, T5ForConditionalGeneration đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Khởi tạo tokenizer và model từ mô hình pretrained "t5-small".
  • Mã hóa (encode) prompt đầu vào bằng tokenizer, đảm bảo trả về tensor của PyTorch.
  • Dịch prompt đầu vào bằng model và sinh ra bản dịch.