Creación de una función de recuperación

Un proceso clave en el flujo de trabajo de generación aumentada por recuperación (RAG) es la recuperación de datos de la base de datos. En este ejercicio, diseñarás una función personalizada llamada « retrieve() » que realizará este proceso crucial en el ejercicio final del curso.

Este ejercicio forma parte del curso

Bases de datos vectoriales para incrustaciones con Pinecone

Instrucciones del ejercicio

Inicializa el cliente Pinecone con tu clave API (el cliente OpenAI está disponible en client).
Define la función retrieve que toma cuatro parámetros: query, top_k, namespace y emb_model.
Incrusta la entrada query utilizando el argumento emb_model.
Recupera los vectores similares a top_k y query_emb con metadatos, especificando el namespace proporcionado a la función como argumento.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Initialize the Pinecone client
pc = Pinecone(api_key="____")
index = pc.Index('pinecone-datacamp')

# Define a retrieve function that takes four arguments: query, top_k, namespace, and emb_model
def retrieve(query, top_k, namespace, emb_model):
    # Encode the input query using OpenAI
    query_response = ____(
        input=____,
        model=____
    )
    
    query_emb = query_response.data[0].embedding
    
    # Query the index using the query_emb
    docs = index.query(vector=____, top_k=____, namespace=____, include_metadata=True)
    
    retrieved_docs = []
    sources = []
    for doc in docs['matches']:
        retrieved_docs.append(doc['metadata']['text'])
        sources.append((doc['metadata']['title'], doc['metadata']['url']))
    
    return retrieved_docs, sources

documents, sources = retrieve(
  query="How to build next-level Q&A with OpenAI",
  top_k=3,
  namespace='youtube_rag_dataset',
  emb_model="text-embedding-3-small"
)
print(documents)
print(sources)

Editar y ejecutar código

Este ejercicio forma parte del curso

Bases de datos vectoriales para incrustaciones con Pinecone

IntermedioNivel de habilidad

4.8+

Comienza el curso gratis

Explora la mecánica que hay detrás de la base de datos vectorial de Pinecone, desde los pods y los índices hasta su comparación con otras bases de datos. Aprende a diferenciar los tipos de pods, adquirir claves API e inicializar la conexión con Pinecone utilizando Python. Por último, aprenderás a crear índices Pinecone, explorando diferentes parámetros como la dimensionalidad, las métricas de distancia, los tipos de pods y otros.

Exercise 1: Introducción a los índices Pinecone Exercise 2: Creación de un cliente Pinecone Exercise 3: Tu primer índice Pinecone Exercise 4: Gestión de índices Exercise 5: Conexión a un índice Exercise 6: Eliminar un índice Exercise 7: El ecosistema Pinecone Exercise 8: Ingestión de vectores Exercise 9: Comprobación de la dimensionalidad Exercise 10: Ingestión de vectores con metadatos

Ponte manos a la obra con Pinecone en Python, donde exploramos el lado práctico del uso de Pinecone para gestionar índices, añadir vectores con metadatos, buscar y recuperar vectores, y realizar actualizaciones o eliminaciones. Obtén un conocimiento sólido de las funciones y conceptos clave para manejar con fluidez los datos en la base de datos vectorial Pinecone.

Exercise 1: Recuperación de vectores Exercise 2: Consultar frente a recuperar Exercise 3: Obtención de vectores Exercise 4: Consultar vectores Exercise 5: Devolver los vectores más similares Exercise 6: Cambiar las métricas de distancia Exercise 7: Filtrado de metadatos Exercise 8: Filtrar consultas Exercise 9: Múltiples filtros de metadatos Exercise 10: Actualización y eliminación de vectores Exercise 11: Actualización de valores vectoriales Exercise 12: Actualización de metadatos vectoriales Exercise 13: Eliminación de vectores

En este capítulo, los alumnos profundizan en la optimización del rendimiento del índice Pinecone, el aprovechamiento de los espacios de nombres multitenant para reducir costes, la creación de motores de búsqueda semántica y la creación de sistemas de respuesta a preguntas con recuperación aumentada utilizando Pinecone con la API de OpenAI. A través de estas lecciones, los alumnos adquieren habilidades prácticas en el ajuste del rendimiento, la búsqueda semántica y la respuesta a preguntas con recuperación ampliada, lo que les permite aplicar Pinecone de forma eficaz en aplicaciones de IA del mundo real.

Exercise 1: Agrupar actualizaciones Exercise 2: Definición de una función para fragmentar Exercise 3: Agrupar actualizaciones en bloques Exercise 4: Agrupar actualizaciones en paralelo Exercise 5: Multitenencia y espacios de nombres Exercise 6: Espacios de nombres Exercise 7: Consultar espacios de nombres Exercise 8: Búsqueda semántica con Pinecone Exercise 9: Creación y configuración de un índice Pinecone Exercise 10: Inserción ascendente de vectores para la búsqueda semántica Exercise 11: Consulta de vectores para la búsqueda semántica Exercise 12: Chatbot RAG con Pinecone y OpenAI Exercise 13: Actualización de transcripciones de YouTube Exercise 14: Creación de una función de recuperación

Ejercicio actual

Exercise 15: Función de respuesta a preguntas sobre RAG Exercise 16: ¡Enhorabuena!