1. Learn
  2. /
  3. कोर्स
  4. /
  5. OpenAI API के साथ Embeddings परिचय

Connected

अभ्यास

रिव्यू सेंटिमेंट का वर्गीकरण

अब जब आपने embeddings निकाल लिए हैं, तो cosine distances compute करने और सबसे मिलता-जुलता label निकालने का समय है.

आप यह find_closest() नाम का एक फंक्शन परिभाषित करके करेंगे, जो एक वेक्टर और कई अन्य वेक्टरों के embeddings की तुलना कर सकता है, और निकटतम दूरी तथा उसका index लौटा सकता है. फिर आप सभी reviews पर लूप चलाएँगे और प्रत्येक review के लिए सबसे नज़दीकी दूरी पाने हेतु find_closest() का उपयोग करेंगे, तथा index के आधार पर classify किया गया label निकालेंगे.

पिछले अभ्यास में आपने जो class_embeddings और review_embeddings ऑब्जेक्ट बनाए थे, वे उपयोग के लिए उपलब्ध हैं. साथ ही reviews और sentiments भी उपलब्ध हैं.

निर्देश

100 XP
  • find_closest() नाम का एक फंक्शन परिभाषित करें जो query_vector के सबसे समान embedding की दूरी और index लौटाए.
  • find_closest() का उपयोग करके हर review के embeddings और class_embeddings के बीच सबसे नज़दीकी दूरी निकालें.
  • closest के 'index' का उपयोग करके sentiments को subset करें और 'label' निकालें.