KMeans का उपयोग करके स्टॉक्स क्लस्टर करना

इस अभ्यास में, आप कंपनियों को उनके डेली स्टॉक प्राइस मूवमेंट्स के आधार पर क्लस्टर करेंगे (अर्थात प्रत्येक ट्रेडिंग डे के लिए क्लोज़िंग और ओपनिंग प्राइस के बीच डॉलर का अंतर). आपको 2010 से 2015 तक के डेली प्राइस मूवमेंट्स का एक NumPy ऐरे movements दिया गया है (Yahoo! Finance से प्राप्त), जहाँ हर पंक्ति एक कंपनी के लिए है और हर कॉलम एक ट्रेडिंग डे के लिए.

कुछ स्टॉक्स अन्य की तुलना में महंगे होते हैं. इसे ध्यान में रखते हुए, अपनी पाइपलाइन की शुरुआत में एक Normalizer शामिल करें. क्लस्टरिंग शुरू होने से पहले Normalizer हर कंपनी के स्टॉक प्राइस को अलग-अलग एक सापेक्ष स्केल पर ट्रांसफॉर्म करेगा.

ध्यान दें कि Normalizer() StandardScaler() से अलग है, जिसे आपने पिछले अभ्यास में इस्तेमाल किया था. जहाँ StandardScaler() औसत हटाकर और यूनिट वैरिएंस पर स्केल करके features (जैसे पिछले अभ्यास के मछलियों के डेटा के फीचर्स) को स्टैंडर्डाइज़ करता है, वहीं Normalizer() प्रत्येक sample — यहाँ प्रत्येक कंपनी के स्टॉक प्राइस — को दूसरों से स्वतंत्र रूप से रिस्केल करता है.

KMeans और make_pipeline पहले से आपके लिए इम्पोर्ट किए गए हैं.

sklearn.preprocessing से Normalizer इम्पोर्ट करें.
Normalizer का एक इंस्टेंस बनाएँ और उसे normalizer नाम दें.
KMeans का एक इंस्टेंस बनाएँ और 10 क्लस्टर्स सेट करके उसे kmeans नाम दें.
make_pipeline() का उपयोग करके pipeline नाम की एक पाइपलाइन बनाएँ जो normalizer और kmeans को चेन करे.
movements ऐरे पर पाइपलाइन को फिट करें.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}अभ्यास

निर्देश

अभ्यास