Primeiros passos com divisão de texto
Hora de começar a dividir! Você recebeu uma afirmação sobre RAG armazenada na variável string text. Sua tarefa é dividir essa string nas ocorrências do caractere '.'. Dê uma olhada nos resultados da divisão para ver como essa estratégia se saiu.
Este exercício faz parte do curso
Retrieval Augmented Generation (RAG) com LangChain
Instruções do exercício
- Defina um divisor de texto por caractere do LangChain que divida pelo caractere
'.', com tamanho de chunk75e sobreposição de chunk10. - Divida
textusando otext_splitterque você definiu.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
text = '''RAG (retrieval augmented generation) is an advanced NLP model that combines retrieval mechanisms with generative capabilities. RAG aims to improve the accuracy and relevance of its outputs by grounding responses in precise, contextually appropriate data.'''
# Define a text splitter that splits on the '.' character
text_splitter = ____(
____,
____,
____
)
# Split the text using text_splitter
chunks = text_splitter.____
print(chunks)
print([len(chunk) for chunk in chunks])