Mulai membagi teks
Saatnya mulai membagi! Anda telah disediakan sebuah pernyataan tentang RAG yang disimpan dalam variabel string text. Tugas Anda adalah membagi string ini pada kemunculan karakter '.'. Periksa hasil pembagiannya untuk melihat bagaimana kinerja strategi ini.
Latihan ini merupakan bagian dari kursus
Retrieval Augmented Generation (RAG) dengan LangChain
Instruksi latihan
- Definisikan pemecah teks karakter LangChain yang akan membagi pada karakter
'.'dengan ukuran potongan75dan tumpang tindih potongan10. - Bagi
textmenggunakantext_splitteryang Anda definisikan.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
text = '''RAG (retrieval augmented generation) is an advanced NLP model that combines retrieval mechanisms with generative capabilities. RAG aims to improve the accuracy and relevance of its outputs by grounding responses in precise, contextually appropriate data.'''
# Define a text splitter that splits on the '.' character
text_splitter = ____(
____,
____,
____
)
# Split the text using text_splitter
chunks = text_splitter.____
print(chunks)
print([len(chunk) for chunk in chunks])