ComeçarComece de graça

Primeiros passos com divisão de texto

Hora de começar a dividir! Você recebeu uma afirmação sobre RAG armazenada na variável string text. Sua tarefa é dividir essa string nas ocorrências do caractere '.'. Dê uma olhada nos resultados da divisão para ver como essa estratégia se saiu.

Este exercício faz parte do curso

Retrieval Augmented Generation (RAG) com LangChain

Ver curso

Instruções do exercício

  • Defina um divisor de texto por caractere do LangChain que divida pelo caractere '.', com tamanho de chunk 75 e sobreposição de chunk 10.
  • Divida text usando o text_splitter que você definiu.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

text = '''RAG (retrieval augmented generation) is an advanced NLP model that combines retrieval mechanisms with generative capabilities. RAG aims to improve the accuracy and relevance of its outputs by grounding responses in precise, contextually appropriate data.'''

# Define a text splitter that splits on the '.' character
text_splitter = ____(
    ____,
    ____,  
    ____  
)

# Split the text using text_splitter
chunks = text_splitter.____
print(chunks)
print([len(chunk) for chunk in chunks])
Editar e executar o código