NMF दस्तावेज़ों के टॉपिक सीखता है

वीडियो में आपने देखा कि जब NMF को दस्तावेज़ों पर लागू किया जाता है, तो कॉम्पोनेंट्स दस्तावेज़ों के टॉपिक से मेल खाते हैं, और NMF फीचर्स उन्हीं टॉपिक से दस्तावेज़ों का पुनर्निर्माण करते हैं. इसे आप खुद जाँचिए उस NMF मॉडल पर जो आपने पहले Wikipedia आर्टिकल्स पर बनाया था. पहले आपने देखा था कि 3rd NMF फीचर का मान ऐक्ट्रेस Anne Hathaway और Denzel Washington वाले आर्टिकल्स के लिए ऊँचा था. इस अभ्यास में, संबंधित NMF कॉम्पोनेंट के टॉपिक की पहचान कीजिए.

आपका पहले बनाया हुआ NMF मॉडल model नाम से उपलब्ध है, जबकि words उन शब्दों की लिस्ट है जो वर्ड-फ्रीक्वेंसी ऐरे के कॉलम लेबल करती है.

पूरा करने के बाद, एक पल लेकर यह पहचानिए कि Anne Hathaway और Denzel Washington के आर्टिकल्स में साझा टॉपिक क्या है!

pandas को pd नाम से इम्पोर्ट करें.
model.components_ से DataFrame components_df बनाएँ, और कॉलम को शब्दों से लेबल करने के लिए columns=words सेट करें.
DataFrame के डायमेंशन्स जाँचने के लिए components_df.shape प्रिंट करें.
DataFrame components_df पर .iloc[] ऐक्सेसर का उपयोग करके पंक्ति 3 चुनें. परिणाम को component में असाइन करें.
component की .nlargest() मेथड कॉल करें और परिणाम प्रिंट करें. इससे उस कॉम्पोनेंट के लिए सबसे बड़े मान वाले पाँच शब्द मिलेंगे.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}अभ्यास

निर्देश

अभ्यास