1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Retrieval Augmented Generation (RAG) với LangChain

Connected

Bài tập

Embed và lưu trữ tài liệu

Bước cuối cùng để chuẩn bị tài liệu cho truy xuất là embed và lưu trữ chúng. Bạn sẽ dùng mô hình text-embedding-3-small từ OpenAI để embed các đoạn (chunk) tài liệu và lưu chúng trong cơ sở dữ liệu vector Chroma cục bộ.

Các chunks bạn đã tạo bằng cách tách đệ quy bài báo Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks đã được nạp sẵn.

Trong bài tập này không yêu cầu tạo hoặc dùng OpenAI API key. Bạn có thể giữ nguyên placeholder <OPENAI_API_TOKEN>, yêu cầu này vẫn hợp lệ khi gửi tới OpenAI API.

Hướng dẫn

100 XP
  • Khởi tạo mô hình embedding mặc định từ OpenAI.
  • Embed các chunks tài liệu bằng embedding_model và lưu chúng vào cơ sở dữ liệu vector Chroma.