ComeçarComece gratuitamente

PDF carregadores de documentos

Para começar a implementar o Retrieval Augmented Generation (RAG), primeiro você precisará carregar os documentos que o modelo acessará. Esses documentos podem vir de várias fontes, e o LangChain oferece suporte a carregadores de documentos para muitas delas.

Neste exercício, você usará um carregador de documentos para carregar um documento PDF contendo o papel, RAG VS Fine-Tuning: Pipelines, Tradeoffs, and a Case Study on Agriculture por Balaguer et al. (2024).

Observação: pypdf, uma dependência para carregar documentos PDF no LangChain, já foi instalado para você.

Este exercício faz parte do curso

Desenvolvimento de aplicativos LLM com LangChain

Ver Curso

Instruções de exercício

  • Importe a classe apropriada para carregar documentos PDF no LangChain.
  • Crie um carregador de documentos para o documento 'rag_vs_fine_tuning.pdf', que está disponível no diretório atual.
  • Carregue o documento na memória para visualizar o conteúdo do primeiro documento ou página.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_vs_fine_tuning.pdf
loader = ____

# Load the document
data = ____
print(data[0])
Editar e executar código