1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát triển ứng dụng LLM với LangChain

Connected

Bài tập

Trình tải tài liệu PDF

Để bắt đầu triển khai Retrieval Augmented Generation (RAG), trước tiên bạn cần tải các tài liệu mà mô hình sẽ truy cập. Những tài liệu này có thể đến từ nhiều nguồn khác nhau, và LangChain hỗ trợ các trình tải tài liệu cho nhiều nguồn.

Trong bài tập này, bạn sẽ dùng một trình tải tài liệu để nạp tệp PDF chứa bài báo RAG VS Fine-Tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture của Balaguer và cộng sự (2024).

Lưu ý: pypdf, một phụ thuộc dùng để tải tài liệu PDF trong LangChain, đã được cài đặt sẵn cho bạn.

Hướng dẫn

100 XP
  • Import lớp phù hợp để tải tài liệu PDF trong LangChain.
  • Tạo một trình tải tài liệu cho tệp 'rag_vs_fine_tuning.pdf', tệp này có sẵn trong thư mục hiện tại.
  • Tải tài liệu vào bộ nhớ để xem nội dung của tài liệu, hay trang, đầu tiên.