RAG için PDF dosyalarını yükleme
Retrieval Augmented Generation (RAG) uygulamaya başlamak için önce modelin erişeceği belgeleri yüklemen gerekir. Bu belgeler farklı kaynaklardan gelebilir ve LangChain bunların birçoğu için belge yükleyicileri sunar.
Bu egzersizde, Lewis ve ark. (2021) tarafından yazılan Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks makalesini içeren bir PDF belgesini yüklemek için bir belge yükleyici kullanacaksın. Bu dosya senin için 'rag_paper.pdf' olarak hazır.
Not: LangChain'de PDF belgelerini yüklemek için gereken bağımlılık pypdf senin için zaten yüklendi.
Bu egzersiz
LangChain ile Retrieval Augmented Generation (RAG)
kursunun bir parçasıdırEgzersiz talimatları
- LangChain'de PDF belgelerini yüklemek için uygun sınıfı içe aktar.
'rag_paper.pdf'belgesi için bir belge yükleyici oluştur.- İlk belgeyi veya sayfayı görebilmek için belgeyi belleğe yükle.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import library
from langchain_community.document_loaders import ____
# Create a document loader for rag_paper.pdf
loader = ____
# Load the document
data = ____
print(data[0])