क्लस्टरिंग के लिए मछली डेटा को स्केल करना

आपको मछलियों के माप देने वाला एक ऐरे samples दिया गया है. प्रत्येक पंक्ति एक अलग मछली का प्रतिनिधित्व करती है. दिए गए माप — जैसे ग्राम में वज़न, सेंटीमीटर में लंबाई, और ऊँचाई-से-लंबाई का प्रतिशत अनुपात — बहुत अलग स्केल पर हैं. इस डेटा को प्रभावी ढंग से क्लस्टर करने के लिए, आपको पहले इन फीचर्स को स्टैंडर्डाइज़ करना होगा. इस अभ्यास में, आप डेटा को स्टैंडर्डाइज़ और क्लस्टर करने के लिए एक पाइपलाइन बनाएँगे.

ये मछली मापन डेटा Journal of Statistics Education से लिए गए हैं.

इम्पोर्ट करें:
- sklearn.pipeline से make_pipeline.
- sklearn.preprocessing से StandardScaler.
- sklearn.cluster से KMeans.
StandardScaler का एक इंस्टेंस scaler नाम से बनाएँ.
KMeans का एक इंस्टेंस 4 क्लस्टर्स के साथ kmeans नाम से बनाएँ.
pipeline नाम की एक पाइपलाइन बनाएँ जो scaler और kmeans को चेन करे. ऐसा करने के लिए, बस इन्हें make_pipeline() में आर्ग्युमेंट्स के रूप में पास करें.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}अभ्यास

निर्देश

अभ्यास