RAG için PDF dosyalarını yükleme
Retrieval Augmented Generation (RAG) uygulamaya başlamak için önce modelin erişeceği belgeleri yüklemen gerekir. Bu belgeler farklı kaynaklardan gelebilir ve LangChain bunların birçoğu için belge yükleyicileri sunar.
Bu egzersizde, Lewis ve ark. (2021) tarafından yazılan Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks makalesini içeren bir PDF belgesini yüklemek için bir belge yükleyici kullanacaksın. Bu dosya senin için 'rag_paper.pdf' olarak hazır.
Not: LangChain'de PDF belgelerini yüklemek için gereken bağımlılık pypdf senin için zaten yüklendi.
Bu egzersiz, kursun bir parçasıdır
LangChain ile Retrieval Augmented Generation (RAG)
Egzersiz talimatları
- LangChain'de PDF belgelerini yüklemek için uygun sınıfı içe aktar.
'rag_paper.pdf'belgesi için bir belge yükleyici oluştur.- İlk belgeyi veya sayfayı görebilmek için belgeyi belleğe yükle.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Import library
from langchain_community.document_loaders import ____
# Create a document loader for rag_paper.pdf
loader = ____
# Load the document
data = ____
print(data[0])