PDF Document Loader

Um mit der Implementierung von Retrieval Augmented Generation (RAG) zu beginnen, musst du zunächst die Dokumente laden, auf die das Modell zugreifen soll. Diese Dokumente können aus verschiedenen Quellen stammen, wovon viele von LangChain mithilfe von passenden Document Loader unterstützt werden.

In dieser Übung wirst du einen Document Loader verwenden, um ein PDF-Dokument mit dem Artikel RAG VS Fine-Tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture von Balaguer et al. (2024) zu laden.

Hinweis: pypdf, eine Abhängigkeit zum Laden von PDF-Dokumenten in LangChain, wurde bereits für dich installiert.

Diese Übung ist Teil des Kurses

<Kurs>Entwickeln von LLM-Anwendungen mit LangChain</Kurs>

Übungsanweisungen

Importiere die passende Klasse zum Laden von PDF-Dokumenten in LangChain.
Erstelle einen Document Loader für das Dokument 'rag_vs_fine_tuning.pdf', das im aktuellen Verzeichnis liegt.
Lade das Dokument in den Speicher, um den Inhalt des ersten Dokuments bzw. der ersten Seite anzuzeigen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_vs_fine_tuning.pdf
loader = ____

# Load the document
data = ____
print(data[0])

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

<Kurs>Entwickeln von LLM-Anwendungen mit LangChain</Kurs>

Mittlere SchwierigkeitSchwierigkeitsgrad

4.8+

Kurs kostenlos starten

Willkommen beim LangChain-Framework zum Erstellen von Anwendungen mit LLMs! Du lernst die wichtigsten Komponenten von LangChain kennen, wie Modelle, Ketten, Agenten, Eingabeaufforderungen (Prompts) und Parser. Du wirst Chatbots mit Open-Source-Modellen von Hugging Face und proprietären Modellen von OpenAI erstellen, Prompt-Vorlagen erstellen und verschiedene Chatbot-Speicherstrategien integrieren, um den Kontext des Modells und die Ressourcen während der Unterhaltungen zu verwalten.

Exercise 1: Das LangChain-Ökosystem Exercise 2: OpenAI-Modelle in LangChain!Exercise 3: Hugging Face-Modelle in LangChain!Exercise 4: Prompt-Vorlagen Exercise 5: Prompt-Vorlagen und Verkettung Exercise 6: Vorlagen für Chat-Prompts Exercise 7: Few-Shot (wenige Beispiele) Prompting Exercise 8: Einen Few-Shot-Beispieldatensatzes erstellen Exercise 9: Erstellen der Few-Shot-Prompt-Vorlage Exercise 10: Implementierung von Few-Shot-Prompting

Zeit, deine LangChain-Ketten auf ein neues Niveau zu bringen! Du lernst, wie du die LangChain Expression Language (LCEL) nutzen kannst, um Ketten flexibler zu definieren. Du erstellst sequenzielle Ketten, in denen Eingaben zwischen Komponenten weitergegeben werden, um komplexere Anwendungen zu erstellen. Durch die Integration von Agenten wirst du LLMs für die Entscheidungsfindung nutzen.

Exercise 1: Sequenzielle Ketten Exercise 2: Bauanleitung für sequenzielle Ketten Exercise 3: Sequenzielle Ketten mit LCEL Exercise 4: Einführung in LangChain-Agenten Exercise 5: Was ist ein Agent?Exercise 6: ReAct-Agenten Exercise 7: Individuelle Werkzeug für Agenten Exercise 8: Eine Funktion für den Werkzeuggebrauch definieren Exercise 9: Individuelle Werkzeuge erstellen Exercise 10: Integration von individuellen Werkzeugen mit Agenten

Eine Einschränkung von LLMs ist, dass sie nur mit Informationen bis zu einem bestimmten Datum trainiert werden können und daher ihr Wissen begrenzt ist. In diesem Kapitel lernst du, wie du Anwendungen erstellst, die Retrieval Augmented Generation (RAG) nutzen, um externe Daten LLMs zugänglich zu machen. Der RAG-Workflow besteht aus verschiedenen Prozessen, wie zum Beispiel das Aufteilen von Daten, das Erstellen und Speichern der Vektoreinbettungen mit einer Vektordatenbank und das Abrufen der relevantesten Infos für die Anwendung. Du lernst den ganzen Ablauf zu meistern!

Exercise 1: Document Loader integrieren Exercise 2: PDF Document Loader

Aktuelle Übung

Exercise 3: CSV Document Loader Exercise 4: HTM Document Loader Exercise 5: Aufteilen externer Daten für den Abruf Exercise 6: Aufteilen nach Zeichen Exercise 7: Rekursives Aufteilen nach Zeichen Exercise 8: HTML teilen Exercise 9: RAG-Speicherung und -Abruf mit Vektordatenbanken Exercise 10: Vorbereitung der Dokumente und der Vektordatenbank Exercise 11: Erstellen einer Vorlage für Abfrage-Prompts Exercise 12: Eine RAG-Kette erstellen Exercise 13: Zusammenfassung