Descubre cómo integrar fuentes de datos externas en modelos de chat con LangChain. Aprende a cargar, dividir, generar embeddings, almacenar y recuperar datos para usarlos en aplicaciones con LLMs.

Cargar documentos para RAG con LangChain

Cargar archivos PDF para RAG

Cargar archivos HTML para RAG

División de texto, embeddings y almacenamiento vectorial

Primeros pasos con la división de texto

Dividir documentos de forma recursiva

Generar embeddings y almacenar documentos

Crear una cadena de recuperación con LCEL

Crear el prompt de recuperación

Crear la cadena de recuperación

Crear aplicaciones RAG con LangChain

Descubre técnicas de vanguardia para cargar, dividir y recuperar documentos, incluyendo cargar archivos de Python, dividir semánticamente y usar métodos de recuperación MRR y self-query. Aprende a evaluar tu arquitectura RAG con métricas y frameworks sólidos.

Carga y división de archivos de código

Cargar archivos de código

Dividir archivos de Python

Métodos avanzados de división

Dividir por tokens

Dividir de forma semántica

Optimizar la recuperación de documentos

Recuperación dispersa vs. densa

Entendiendo BM25

Recuperación dispersa con BM25

Introducción a la evaluación de RAG

Evaluación de precisión de contexto con Ragas

Evaluación de fidelidad con Ragas

Evaluación de cadenas

Mejorar la arquitectura RAG

Descubre cómo las bases de datos de grafos y la recuperación basada en grafos pueden superar algunas limitaciones del almacenamiento y la recuperación tradicionales basados en vectores.

De vectores a grafos

Creación de documentos de grafo

Conociendo los grafos

Almacenar y consultar documentos

Ampliando tu base de datos de grafos

Consultar tu base de datos de grafos

Crear la cadena de Graph RAG

Un viaje por el sistema Graph RAG

¡Encadenando al estilo Graph RAG!

Mejorar la recuperación en grafos

Graph RAG con filtrado

Validar consultas Cypher

Crear un prompt few-shot para Cypher

¡Enhorabuena!

Introducción a Graph RAG

RAG Academic Paper PDF

DataCamp Blog HTML

LangChain README Markdown

Chatbot Python File

RAG Workflow Python File

Los Large Language Models (LLMs) se están integrando en ordenadores, móviles y aplicaciones de software, pero tienen una limitación: su conocimiento depende de los datos de entrenamiento, que son lentos y costosos de actualizar. ¡Ahí entra Retrieval Augmented Generation (RAG)! RAG te permite integrar datos externos con LLMs. En este curso, aprenderás técnicas de vanguardia para cargar, procesar y recuperar datos externos para LLMs. Utilizarás bases de datos vectoriales, los LLMs más recientes, incluido GPT-4o-Mini, y el framework LangChain para crear aplicaciones RAG. El curso termina con un capítulo sobre Graph RAG, una variante del RAG tradicional que usa bases de datos de grafos para una recuperación de datos más fiable.

<h2>Crea sistemas RAG con LangChain</h2>La generación aumentada por recuperación (RAG) es una técnica que se utiliza para superar una de las principales limitaciones de los modelos de lenguaje grandes (LLM): su conocimiento limitado. Los sistemas RAG integran datos externos procedentes de diversas fuentes en los LLM. Este proceso de conectar múltiples sistemas diferentes suele ser tedioso, ¡pero LangChain lo convierte en un juego de niños!<br><br><h2>Aprende métodos de división y recuperación de última generación.</h2>¡Mejora tu arquitectura RAG! Aprenderás a cargar y dividir archivos de código, incluidos archivos Python y Markdown, para garantizar que las divisiones «reconozcan» la sintaxis del código. Dividirás tus documentos utilizando tokens en lugar de caracteres para garantizar que los documentos recuperados permanezcan dentro de la ventana de contexto de tu modelo. Descubre cómo la división semántica puede ayudar a conservar el contexto detectando cuándo cambia el tema en el texto y dividiéndolo en esos puntos. Por último, aprende a evaluar tu arquitectura RAG de forma sólida con LangSmith y Ragas.<br><br><h2>Descubre la arquitectura Graph RAG</h2>Da un giro radical a tu arquitectura RAG y descubre cómo los sistemas RAG basados en grafos, en lugar de vectores, pueden mejorar la comprensión de tu sistema de las entidades y relaciones presentes en tus documentos. ¡Aprenderás a convertir datos de texto no estructurados en gráficos utilizando LLM para realizar la traducción! A continuación, almacenarás estos documentos gráficos en una base de datos gráfica Neo4j y los integrarás en un sistema RAG más amplio para completar la aplicación.

Developing LLM Applications with LangChain

Aprende métodos avanzados para integrar datos externos con LLMs usando RAG con LangChain.

Retrieval Augmented Generation (RAG) con LangChain

Aprende novedosos métodos para integrar datos externos con LLM utilizando la generación aumentada por recuperación (RAG) con LangChain.

Desarrollar aplicaciones con LangChain

Generar embeddings y almacenar documentos

Retrieval Augmented Generation (RAG) con LangChain

Instrucciones del ejercicio

Ejercicio interactivo práctico