1. 학습
  2. /
  3. 강의
  4. /
  5. LangChain으로 배우는 Retrieval Augmented Generation (RAG)

Connected

연습 문제

RAG를 위한 PDF 파일 로딩

Retrieval Augmented Generation(RAG)을 구현하려면, 먼저 모델이 참고할 문서를 불러와야 해요. 문서는 다양한 소스에서 올 수 있으며, LangChain은 이러한 소스를 위한 다양한 문서 로더를 지원해요.

이번 연습에서는 문서 로더를 사용해 Lewis 외(2021)의 논문 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks 가 담긴 PDF 문서를 불러올 거예요. 이 파일은 'rag_paper.pdf'로 제공돼요.

참고: LangChain에서 PDF 문서를 로드하는 데 필요한 의존성인 pypdf는 이미 설치되어 있어요.

지침

100 XP
  • LangChain에서 PDF 문서를 로드하기 위한 적절한 클래스를 임포트하세요.
  • 'rag_paper.pdf' 문서를 위한 문서 로더를 생성하세요.
  • 문서를 메모리에 로드하고 첫 번째 문서(또는 페이지)의 내용을 확인하세요.