1. 学ぶ
  2. /
  3. コース
  4. /
  5. OpenAI API ではじめる Embeddings 入門

Connected

演習

最も類似した商品を見つける

埋め込み同士の類似度を計算できることは、Embedding アプリケーションにおける重要なステップです。この演習では、以前に扱った products という辞書のリストに戻ります。このリストには、先ほど作成した短い商品説明の埋め込みが含まれています。

これらの埋め込み済みの説明と、あるテキストを比較して、最も類似した説明を特定します。

numpy は np としてインポート済みで、scipy.spatial から distance が利用できます。単一の入力から埋め込みを作成できる create_embeddings() 関数は、すでに定義済みで利用可能です。

指示

100 XP
  • カスタム関数 create_embeddings() を使ってテキスト "soap" を埋め込み、単一の埋め込みリストを取り出します。
  • query_embedding と product 内の各埋め込みとのコサイン距離を計算します。
  • distances にあるコサイン距離を使って、検索テキストに最も類似した商品の 'short_description' を見つけて出力します。