Primeros pasos con la división de texto
¡Hora de empezar a dividir! Tienes una afirmación sobre RAG almacenada en la variable de tipo cadena text. Tu tarea es dividir esta cadena en cada aparición del carácter '.'. Echa un vistazo a los resultados para ver cómo ha funcionado esta estrategia.
Este ejercicio forma parte del curso
Retrieval Augmented Generation (RAG) con LangChain
Instrucciones del ejercicio
- Define un divisor de texto por caracteres de LangChain que divida por el carácter
'.'con un tamaño de fragmento de75y un solapamiento de10. - Divide
textusando eltext_splitterque definiste.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
text = '''RAG (retrieval augmented generation) is an advanced NLP model that combines retrieval mechanisms with generative capabilities. RAG aims to improve the accuracy and relevance of its outputs by grounding responses in precise, contextually appropriate data.'''
# Define a text splitter that splits on the '.' character
text_splitter = ____(
____,
____,
____
)
# Split the text using text_splitter
chunks = text_splitter.____
print(chunks)
print([len(chunk) for chunk in chunks])