PDF carregadores de documentos
Para começar a implementar o Retrieval Augmented Generation (RAG), primeiro você precisará carregar os documentos que o modelo acessará. Esses documentos podem vir de várias fontes, e o LangChain oferece suporte a carregadores de documentos para muitas delas.
Neste exercício, você usará um carregador de documentos para carregar um documento PDF contendo o papel, RAG VS Fine-Tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture por Balaguer et al. (2024).
Observação: pypdf
, uma dependência para carregar documentos PDF no LangChain, já foi instalado para você.
Este exercício faz parte do curso
Desenvolvimento de aplicativos LLM com LangChain
Instruções de exercício
- Importe a classe apropriada para carregar documentos PDF no LangChain.
- Crie um carregador de documentos para o documento
'rag_vs_fine_tuning.pdf'
, que está disponível no diretório atual. - Carregue o documento na memória para visualizar o conteúdo do primeiro documento ou página.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import library
from langchain_community.document_loaders import ____
# Create a document loader for rag_vs_fine_tuning.pdf
loader = ____
# Load the document
data = ____
print(data[0])