1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में Unsupervised Learning

Connected

अभ्यास

NMF दस्तावेज़ों के टॉपिक सीखता है

वीडियो में आपने देखा कि जब NMF को दस्तावेज़ों पर लागू किया जाता है, तो कॉम्पोनेंट्स दस्तावेज़ों के टॉपिक से मेल खाते हैं, और NMF फीचर्स उन्हीं टॉपिक से दस्तावेज़ों का पुनर्निर्माण करते हैं. इसे आप खुद जाँचिए उस NMF मॉडल पर जो आपने पहले Wikipedia आर्टिकल्स पर बनाया था. पहले आपने देखा था कि 3rd NMF फीचर का मान ऐक्ट्रेस Anne Hathaway और Denzel Washington वाले आर्टिकल्स के लिए ऊँचा था. इस अभ्यास में, संबंधित NMF कॉम्पोनेंट के टॉपिक की पहचान कीजिए.

आपका पहले बनाया हुआ NMF मॉडल model नाम से उपलब्ध है, जबकि words उन शब्दों की लिस्ट है जो वर्ड-फ्रीक्वेंसी ऐरे के कॉलम लेबल करती है.

पूरा करने के बाद, एक पल लेकर यह पहचानिए कि Anne Hathaway और Denzel Washington के आर्टिकल्स में साझा टॉपिक क्या है!

निर्देश

100 XP
  • pandas को pd नाम से इम्पोर्ट करें.
  • model.components_ से DataFrame components_df बनाएँ, और कॉलम को शब्दों से लेबल करने के लिए columns=words सेट करें.
  • DataFrame के डायमेंशन्स जाँचने के लिए components_df.shape प्रिंट करें.
  • DataFrame components_df पर .iloc[] ऐक्सेसर का उपयोग करके पंक्ति 3 चुनें. परिणाम को component में असाइन करें.
  • component की .nlargest() मेथड कॉल करें और परिणाम प्रिंट करें. इससे उस कॉम्पोनेंट के लिए सबसे बड़े मान वाले पाँच शब्द मिलेंगे.