LoslegenKostenlos loslegen

PDF Dokumentenlader

Um mit der Implementierung von Retrieval Augmented Generation (RAG) zu beginnen, musst du zunächst die Dokumente laden, auf die das Modell zugreifen soll. Diese Dokumente können aus einer Vielzahl von Quellen stammen, und LangChain unterstützt Dokumentenlader für viele von ihnen.

In dieser Übung verwendest du einen Dokumentenlader, um ein PDF Dokument zu laden, das das Papier enthält, RAG VS Fine-Tuning: Pipelines, Tradeoffs und eine Fallstudie zur Landwirtschaft von Balaguer et al. (2024).

Hinweis: pypdf, eine Abhängigkeit zum Laden von PDF Dokumenten in LangChain, wurde bereits für dich installiert.

Diese Übung ist Teil des Kurses

Entwicklung von LLM Anwendungen mit LangChain

Kurs anzeigen

Anleitung zur Übung

  • Importiere die entsprechende Klasse zum Laden von PDF Dokumenten in LangChain.
  • Erstelle einen Dokumentenlader für das Dokument 'rag_vs_fine_tuning.pdf', das im aktuellen Verzeichnis verfügbar ist.
  • Lade das Dokument in den Speicher, um den Inhalt des ersten Dokuments bzw. der ersten Seite anzuzeigen.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_vs_fine_tuning.pdf
loader = ____

# Load the document
data = ____
print(data[0])
Code bearbeiten und ausführen