1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में Unsupervised Learning

Connected

अभ्यास

मछली डेटा का क्लस्टरिंग

अब आप पिछले अभ्यास वाली standardization और clustering पाइपलाइन का उपयोग करके मछलियों को उनके मापों के आधार पर क्लस्टर करेंगे, और फिर क्लस्टर लेबल्स की तुलना मछली प्रजातियों से करने के लिए एक क्रॉस-टैबुलेशन बनाएँगे.

पहले की तरह, samples मछली मापों का 2D array है. आपकी पाइपलाइन pipeline नाम से उपलब्ध है, और हर मछली सैंपल की प्रजाति लिस्ट species में दी गई है.

निर्देश

100 XP
  • pandas को pd नाम से इंपोर्ट करें.
  • पाइपलाइन को मछली माप samples पर फिट करें.
  • pipeline की .predict() मेथड का उपयोग करके samples के लिए क्लस्टर लेबल्स प्राप्त करें.
  • pd.DataFrame() का उपयोग करके एक DataFrame df बनाएँ, जिसमें दो कॉलम हों: 'labels' और 'species'. कॉलम वैल्यूज़ के लिए क्रमशः labels और species का उपयोग करें.
  • pd.crosstab() का उपयोग करके df['labels'] और df['species'] की क्रॉस-टैबुलेशन ct बनाएँ.