1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में Unsupervised Learning

Connected

अभ्यास

क्लस्टर लेबल निकालना

पिछले अभ्यास में, आपने देखा कि ऊँचाई 6 पर ग्रेन सैंपल्स की इंटरमीडिएट क्लस्टरिंग में 3 क्लस्टर हैं। अब, इस इंटरमीडिएट क्लस्टरिंग के लिए क्लस्टर लेबल निकालने हेतु fcluster() फंक्शन का उपयोग करें, और ग्रेन वेराइटीज़ के साथ इन लेबल्स की तुलना क्रॉस-टैब्यूलेशन द्वारा करें.

हायरेरकिकल क्लस्टरिंग पहले से की जा चुकी है और mergings linkage() फंक्शन का परिणाम है। लिस्ट varieties हर ग्रेन सैंपल की वेराइटी बताती है.

निर्देश

100 XP
  • इम्पोर्ट करें:
    • pandas को pd के रूप में.
    • scipy.cluster.hierarchy से fcluster.
  • mergings पर fcluster() फंक्शन का उपयोग करके फ्लैट हायरेरकिकल क्लस्टरिंग करें। अधिकतम ऊँचाई 6 और कीवर्ड आर्ग्युमेंट criterion='distance' निर्दिष्ट करें.
  • दो कॉलम 'labels' और 'varieties' वाला DataFrame df बनाएँ, जहाँ कॉलम वैल्यूज़ क्रमशः labels और varieties हों। यह आपके लिए कर दिया गया है.
  • df['labels'] और df['varieties'] के बीच क्रॉस-टैब्यूलेशन ct बनाएँ ताकि यह गिना जा सके कि प्रत्येक ग्रेन वेराइटी कितनी बार प्रत्येक क्लस्टर लेबल से मेल खाती है.