LoslegenKostenlos loslegen

PDF Document Loader

Um mit der Implementierung von Retrieval Augmented Generation (RAG) zu beginnen, musst du zunächst die Dokumente laden, auf die das Modell zugreifen soll. Diese Dokumente können aus verschiedenen Quellen stammen, wovon viele von LangChain mithilfe von passenden Document Loader unterstützt werden.

In dieser Übung wirst du einen Document Loader verwenden, um ein PDF-Dokument mit dem Artikel RAG VS Fine-Tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture von Balaguer et al. (2024) zu laden.

Hinweis: pypdf, eine Abhängigkeit zum Laden von PDF-Dokumenten in LangChain, wurde bereits für dich installiert.

Diese Übung ist Teil des Kurses

Entwickeln von LLM-Anwendungen mit LangChain

Kurs anzeigen

Anleitung zur Übung

  • Importiere die passende Klasse zum Laden von PDF-Dokumenten in LangChain.
  • Erstelle einen Document Loader für das Dokument 'rag_vs_fine_tuning.pdf', das im aktuellen Verzeichnis liegt.
  • Lade das Dokument in den Speicher, um den Inhalt des ersten Dokuments bzw. der ersten Seite anzuzeigen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_vs_fine_tuning.pdf
loader = ____

# Load the document
data = ____
print(data[0])
Code bearbeiten und ausführen