1. Nauka
  2. /
  3. Kursy
  4. /
  5. Tworzenie aplikacji LLM z LangChain

Connected

ćwiczenie

Wczytywanie dokumentów PDF

Aby rozpocząć implementację Retrieval Augmented Generation (RAG), najpierw musisz wczytać dokumenty, do których model będzie miał dostęp. Mogą one pochodzić z różnych źródeł, a LangChain obsługuje loadery dokumentów dla wielu z nich.

W tym ćwiczeniu użyjesz loadera dokumentów, aby wczytać plik PDF zawierający artykuł RAG VS Fine-Tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture autorstwa Balaguer i in. (2024).

Uwaga: pypdf, wymagana zależność do wczytywania dokumentów PDF w LangChain, jest już zainstalowana.

Instrukcje

100 XP
  • Zaimportuj odpowiednią klasę do wczytywania dokumentów PDF w LangChain.
  • Utwórz loader dokumentu dla pliku 'rag_vs_fine_tuning.pdf', który znajduje się w bieżącym katalogu.
  • Załaduj dokument do pamięci, aby wyświetlić zawartość pierwszego dokumentu (strony).