1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 OpenAI API 的 Embeddings 入门

Connected

道练习

评论情感分类

现在您已经计算好了嵌入向量,接下来要计算余弦距离并提取最相似的标签。

您将定义一个名为 find_closest() 的函数,用于将一个向量的嵌入与多个其他向量进行比较,并返回最近的距离及其索引。随后,您会遍历所有评论,并使用 find_closest() 为每条评论找到最近的距离,再根据该索引提取分类后的标签。

上一练习中创建的 class_embeddings 和 review_embeddings 已可直接使用,同时还提供了 reviews 和 sentiments。

说明

100 XP
  • 定义函数 find_closest(),返回与 query_vector 最相似的嵌入向量的距离和索引。
  • 使用 find_closest() 在每条评论的嵌入向量与 class_embeddings 之间找到最近的距离。
  • 使用 closest 的 'index' 对 sentiments 做子集选择,并提取 'label'。