1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 OpenAI API 的 Embeddings 入门

Connected

道练习

按相似度排序

现在您已经为所有特征生成了嵌入向量,下一步是计算相似度。在本练习中,您将定义一个名为 find_n_closest() 的函数,用于计算查询向量与一组嵌入向量之间的余弦距离,并返回 n 个最小距离及其索引。

在下一个练习中,您将使用该函数来驱动语义商品搜索应用。

distance 已从 scipy.spatial 导入。

说明

100 XP
  • 计算 query_vector 与 embedding 之间的余弦距离。
  • 向 distances 列表追加一个包含 dist 及其 index 的字典。
  • 按每个字典的 'distance' 键对 distances 列表进行排序。
  • 返回 distances_sorted 中的前 n 个元素。