1. 学ぶ
  2. /
  3. コース
  4. /
  5. OpenAI API ではじめる Embeddings 入門

Connected

演習

類似度で並べ替える

すべての特徴量を埋め込みに変換できたので、次は類似度を計算します。この演習では、find_n_closest() という関数を定義します。これは、クエリベクトルと埋め込みのリストとのコサイン距離を計算し、最も小さい距離とそのインデックスを n 件返します。

次の演習では、この関数を使って意味検索対応のプロダクト検索アプリケーションを動かします。

distance は scipy.spatial からインポート済みです。

指示

100 XP
  • query_vector と embedding のコサイン距離を計算します。
  • dist とその index を含む辞書を distances リストに追加します。
  • 各辞書の 'distance' キーで distances リストをソートします。
  • distances_sorted の先頭 n 要素を返します。