ComenzarEmpieza gratis

Dividir archivos de Python

Aunque los archivos de texto y de código contienen los mismos caracteres, los archivos de código incluyen estructuras más allá del lenguaje natural. Para conservar este contexto específico del código al dividir documentos, deberías configurar el separador para que primero intente dividir según la estructura de código más común. ¡Por suerte, LangChain ofrece funcionalidad justo para eso!

Ya se han importado por ti todas las clases necesarias, incluida Language de langchain_text_splitters.

Este ejercicio forma parte del curso

Retrieval Augmented Generation (RAG) con LangChain

Ver curso

Instrucciones del ejercicio

  • Crea un separador recursivo por caracteres que divida según estructuras comunes del código Python.
  • Divide el cargador de documentos python_data en fragmentos.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a Python-aware recursive character splitter
python_splitter = RecursiveCharacterTextSplitter.____(
    ____, chunk_size=300, chunk_overlap=100
)

# Split the Python content into chunks
chunks = ____

for i, chunk in enumerate(chunks[:3]):
    print(f"Chunk {i+1}:\n{chunk.page_content}\n")
Editar y ejecutar código