LoslegenKostenlos starten

Erste Schritte mit dem Text-Splitting

Zeit fürs Splitten! Dir wurde eine Aussage über RAG in der String-Variablen text bereitgestellt. Deine Aufgabe ist es, diesen String an Vorkommen des Zeichens '.' zu teilen. Sieh dir die Ergebnisse an, um zu beurteilen, wie diese Strategie funktioniert hat.

Diese Übung ist Teil des Kurses

<Kurs>Retrieval Augmented Generation (RAG) mit LangChain</Kurs>
Kurs ansehen

Übungsanweisungen

  • Definiere einen LangChain-Character-Textsplitter, der am Zeichen '.' teilt, mit einer Chunkgröße von 75 und einer Chunk-Überlappung von 10.
  • Teile text mit dem von dir definierten text_splitter.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

text = '''RAG (retrieval augmented generation) is an advanced NLP model that combines retrieval mechanisms with generative capabilities. RAG aims to improve the accuracy and relevance of its outputs by grounding responses in precise, contextually appropriate data.'''

# Define a text splitter that splits on the '.' character
text_splitter = ____(
    ____,
    ____,  
    ____  
)

# Split the text using text_splitter
chunks = text_splitter.____
print(chunks)
print([len(chunk) for chunk in chunks])
Code bearbeiten und ausführen