PDF Document Loader
Um mit der Implementierung von Retrieval Augmented Generation (RAG) zu beginnen, musst du zunächst die Dokumente laden, auf die das Modell zugreifen soll. Diese Dokumente können aus verschiedenen Quellen stammen, wovon viele von LangChain mithilfe von passenden Document Loader unterstützt werden.
In dieser Übung wirst du einen Document Loader verwenden, um ein PDF-Dokument mit dem Artikel RAG VS Fine-Tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture von Balaguer et al. (2024) zu laden.
Hinweis: pypdf, eine Abhängigkeit zum Laden von PDF-Dokumenten in LangChain, wurde bereits für dich installiert.
Diese Übung ist Teil des Kurses
<Kurs>Entwickeln von LLM-Anwendungen mit LangChain</Kurs>Übungsanweisungen
- Importiere die passende Klasse zum Laden von PDF-Dokumenten in LangChain.
- Erstelle einen Document Loader für das Dokument
'rag_vs_fine_tuning.pdf', das im aktuellen Verzeichnis liegt. - Lade das Dokument in den Speicher, um den Inhalt des ersten Dokuments bzw. der ersten Seite anzuzeigen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import library
from langchain_community.document_loaders import ____
# Create a document loader for rag_vs_fine_tuning.pdf
loader = ____
# Load the document
data = ____
print(data[0])