LoslegenKostenlos loslegen

PDF-Dateien für RAG laden

Um mit Retrieval Augmented Generation (RAG) zu starten, musst du zuerst die Dokumente laden, auf die das Modell zugreift. Diese Dokumente können aus verschiedenen Quellen stammen, und LangChain unterstützt für viele davon passende Document Loader.

In dieser Übung verwendest du einen Document Loader, um ein PDF zu laden, das das Paper Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks von Lewis et al. (2021) enthält. Diese Datei steht dir als 'rag_paper.pdf' zur Verfügung.

Hinweis: pypdf, eine Abhängigkeit zum Laden von PDF-Dokumenten in LangChain, ist bereits für dich installiert.

Diese Übung ist Teil des Kurses

Retrieval Augmented Generation (RAG) mit LangChain

Kurs anzeigen

Anleitung zur Übung

  • Importiere die passende Klasse zum Laden von PDF-Dokumenten in LangChain.
  • Erstelle einen Document Loader für die Datei 'rag_paper.pdf'.
  • Lade das Dokument in den Speicher und sieh dir den Inhalt des ersten Dokuments bzw. der ersten Seite an.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_paper.pdf
loader = ____

# Load the document
data = ____
print(data[0])
Code bearbeiten und ausführen