Prime mosse con la suddivisione del testo
È il momento di iniziare a suddividere! Ti è stata fornita un'affermazione su RAG memorizzata nella variabile stringa text. Il tuo compito è suddividere questa stringa in corrispondenza delle occorrenze del carattere '.'. Dai un'occhiata ai risultati della suddivisione per vedere come ha funzionato questa strategia.
Questo esercizio fa parte del corso
Retrieval Augmented Generation (RAG) con LangChain
Istruzioni dell'esercizio
- Definisci uno splitter di testo per caratteri di LangChain che suddivida sul carattere
'.'con una dimensione del blocco pari a75e una sovrapposizione dei blocchi di10. - Suddividi
textusando iltext_splitterche hai definito.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
text = '''RAG (retrieval augmented generation) is an advanced NLP model that combines retrieval mechanisms with generative capabilities. RAG aims to improve the accuracy and relevance of its outputs by grounding responses in precise, contextually appropriate data.'''
# Define a text splitter that splits on the '.' character
text_splitter = ____(
____,
____,
____
)
# Split the text using text_splitter
chunks = text_splitter.____
print(chunks)
print([len(chunk) for chunk in chunks])