Mulai membagi teks
Saatnya mulai membagi! Anda telah disediakan sebuah pernyataan tentang RAG yang disimpan dalam variabel string text. Tugas Anda adalah membagi string ini pada kemunculan karakter '.'. Periksa hasil pembagiannya untuk melihat bagaimana kinerja strategi ini.
Latihan ini adalah bagian dari kursus
Retrieval Augmented Generation (RAG) dengan LangChain
Petunjuk latihan
- Definisikan pemecah teks karakter LangChain yang akan membagi pada karakter
'.'dengan ukuran potongan75dan tumpang tindih potongan10. - Bagi
textmenggunakantext_splitteryang Anda definisikan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
text = '''RAG (retrieval augmented generation) is an advanced NLP model that combines retrieval mechanisms with generative capabilities. RAG aims to improve the accuracy and relevance of its outputs by grounding responses in precise, contextually appropriate data.'''
# Define a text splitter that splits on the '.' character
text_splitter = ____(
____,
____,
____
)
# Split the text using text_splitter
chunks = text_splitter.____
print(chunks)
print([len(chunk) for chunk in chunks])