Wczytywanie dokumentów PDF

Aby rozpocząć implementację Retrieval Augmented Generation (RAG), najpierw musisz wczytać dokumenty, do których model będzie miał dostęp. Mogą one pochodzić z różnych źródeł, a LangChain obsługuje loadery dokumentów dla wielu z nich.

W tym ćwiczeniu użyjesz loadera dokumentów, aby wczytać plik PDF zawierający artykuł RAG VS Fine-Tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture autorstwa Balaguer i in. (2024).

Uwaga: pypdf, wymagana zależność do wczytywania dokumentów PDF w LangChain, jest już zainstalowana.

Zaimportuj odpowiednią klasę do wczytywania dokumentów PDF w LangChain.
Utwórz loader dokumentu dla pliku 'rag_vs_fine_tuning.pdf', który znajduje się w bieżącym katalogu.
Załaduj dokument do pamięci, aby wyświetlić zawartość pierwszego dokumentu (strony).

ćwiczenie

Wczytywanie dokumentów PDF

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie