Comece agoraComece grátis

Carregando arquivos PDF para RAG

Para começar a implementar Retrieval Augmented Generation (RAG), você primeiro precisa carregar os documentos aos quais o modelo terá acesso. Esses documentos podem vir de várias fontes, e o LangChain oferece carregadores de documentos para muitas delas.

Neste exercício, você vai usar um carregador de documentos para carregar um PDF que contém o artigo Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks de Lewis et al. (2021). Esse arquivo está disponível para você como 'rag_paper.pdf'.

Observação: pypdf, uma dependência para carregar documentos PDF no LangChain, já foi instalada para você.

Este exercicio faz parte do curso

Retrieval Augmented Generation (RAG) com LangChain

Ver curso

Instruções do exercicio

  • Importe a classe apropriada para carregar documentos PDF no LangChain.
  • Crie um carregador de documentos para o arquivo 'rag_paper.pdf'.
  • Carregue o documento na memória para visualizar o conteúdo do primeiro documento, ou página.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Import library
from langchain_community.document_loaders import ____

# Create a document loader for rag_paper.pdf
loader = ____

# Load the document
data = ____
print(data[0])
Editar e Executar Código