1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Retrieval Augmented Generation (RAG) với LangChain

Connected

Bài tập

Tải tệp PDF cho RAG

Để bắt đầu triển khai Retrieval Augmented Generation (RAG), trước tiên bạn cần tải các tài liệu mà mô hình sẽ truy cập. Những tài liệu này có thể đến từ nhiều nguồn khác nhau, và LangChain hỗ trợ bộ nạp (loader) cho nhiều loại nguồn.

Trong bài tập này, bạn sẽ dùng một bộ nạp tài liệu để tải tệp PDF chứa bài báo Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks của Lewis và cộng sự (2021). Tệp này có sẵn với tên 'rag_paper.pdf'.

Lưu ý: pypdf, một phụ thuộc dùng để tải tài liệu PDF trong LangChain, đã được cài đặt sẵn cho bạn.

Hướng dẫn

100 XP
  • Import lớp phù hợp để tải tài liệu PDF trong LangChain.
  • Tạo một bộ nạp tài liệu cho tệp 'rag_paper.pdf'.
  • Tải tài liệu vào bộ nhớ để xem nội dung của tài liệu, hoặc trang, đầu tiên.