1. Nauka
  2. /
  3. Kursy
  4. /
  5. Retrieval Augmented Generation (RAG) z LangChain

Connected

ćwiczenie

Wczytywanie plików PDF do RAG

Aby rozpocząć implementację Retrieval Augmented Generation (RAG), najpierw musisz wczytać dokumenty, do których model będzie miał dostęp. Dokumenty te mogą pochodzić z różnych źródeł, a LangChain obsługuje wiele rodzajów modułów do ich ładowania.

W tym ćwiczeniu użyjesz modułu wczytującego dokumenty, aby załadować plik PDF zawierający artykuł Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks autorstwa Lewisa i in. (2021). Plik jest dostępny pod nazwą 'rag_paper.pdf'.

Uwaga: pypdf, biblioteka wymagana do wczytywania plików PDF w LangChain, jest już zainstalowana.

Instrukcje

100 XP
  • Zaimportuj odpowiednią klasę do wczytywania dokumentów PDF w LangChain.
  • Utwórz moduł wczytujący dla dokumentu 'rag_paper.pdf'.
  • Wczytaj dokument do pamięci, aby wyświetlić zawartość pierwszego dokumentu (strony).