Encontrar o produto mais semelhante
A capacidade de calcular a similaridade entre as incorporações é uma etapa fundamental nos aplicativos de incorporações. Neste exercício, você voltará à lista products
de dicionários com a qual trabalhou anteriormente, que contém as descrições curtas incorporadas que você também criou anteriormente.
Você comparará um trecho de texto com essas descrições incorporadas para identificar a descrição mais semelhante.
numpy
foi importado como np
, e distance
está disponível em scipy.spatial
. Uma função create_embeddings()
já foi definida para você e está disponível para ser usada na criação de embeddings a partir de uma única entrada.
Este exercício faz parte do curso
Introdução aos embeddings com o OpenAI API
Instruções de exercício
- Incorpore o texto,
"soap"
, usando a função personalizadacreate_embeddings()
e extraia uma única lista de incorporações. - Calcule a distância de cosseno entre
query_embedding
e as incorporações emproduct
. - Encontre e imprima o endereço
'short_description'
do produto mais semelhante ao texto de pesquisa usando as distâncias de cosseno emdistances
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Embed the search text
search_text = "soap"
search_embedding = ____
distances = []
for product in products:
# Compute the cosine distance for each product description
dist = ____(search_embedding, ____)
distances.append(dist)
# Find and print the most similar product short_description
min_dist_ind = ____
print(____)