1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में Unsupervised Learning

Connected

अभ्यास

क्लस्टरिंग के लिए मछली डेटा को स्केल करना

आपको मछलियों के माप देने वाला एक ऐरे samples दिया गया है. प्रत्येक पंक्ति एक अलग मछली का प्रतिनिधित्व करती है. दिए गए माप — जैसे ग्राम में वज़न, सेंटीमीटर में लंबाई, और ऊँचाई-से-लंबाई का प्रतिशत अनुपात — बहुत अलग स्केल पर हैं. इस डेटा को प्रभावी ढंग से क्लस्टर करने के लिए, आपको पहले इन फीचर्स को स्टैंडर्डाइज़ करना होगा. इस अभ्यास में, आप डेटा को स्टैंडर्डाइज़ और क्लस्टर करने के लिए एक पाइपलाइन बनाएँगे.

ये मछली मापन डेटा Journal of Statistics Education से लिए गए हैं.

निर्देश

100 XP
  • इम्पोर्ट करें:
    • sklearn.pipeline से make_pipeline.
    • sklearn.preprocessing से StandardScaler.
    • sklearn.cluster से KMeans.
  • StandardScaler का एक इंस्टेंस scaler नाम से बनाएँ.
  • KMeans का एक इंस्टेंस 4 क्लस्टर्स के साथ kmeans नाम से बनाएँ.
  • pipeline नाम की एक पाइपलाइन बनाएँ जो scaler और kmeans को चेन करे. ऐसा करने के लिए, बस इन्हें make_pipeline() में आर्ग्युमेंट्स के रूप में पास करें.