1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में Unsupervised Learning

Connected

अभ्यास

KMeans का उपयोग करके स्टॉक्स क्लस्टर करना

इस अभ्यास में, आप कंपनियों को उनके डेली स्टॉक प्राइस मूवमेंट्स के आधार पर क्लस्टर करेंगे (अर्थात प्रत्येक ट्रेडिंग डे के लिए क्लोज़िंग और ओपनिंग प्राइस के बीच डॉलर का अंतर). आपको 2010 से 2015 तक के डेली प्राइस मूवमेंट्स का एक NumPy ऐरे movements दिया गया है (Yahoo! Finance से प्राप्त), जहाँ हर पंक्ति एक कंपनी के लिए है और हर कॉलम एक ट्रेडिंग डे के लिए.

कुछ स्टॉक्स अन्य की तुलना में महंगे होते हैं. इसे ध्यान में रखते हुए, अपनी पाइपलाइन की शुरुआत में एक Normalizer शामिल करें. क्लस्टरिंग शुरू होने से पहले Normalizer हर कंपनी के स्टॉक प्राइस को अलग-अलग एक सापेक्ष स्केल पर ट्रांसफॉर्म करेगा.

ध्यान दें कि Normalizer() StandardScaler() से अलग है, जिसे आपने पिछले अभ्यास में इस्तेमाल किया था. जहाँ StandardScaler() औसत हटाकर और यूनिट वैरिएंस पर स्केल करके features (जैसे पिछले अभ्यास के मछलियों के डेटा के फीचर्स) को स्टैंडर्डाइज़ करता है, वहीं Normalizer() प्रत्येक sample — यहाँ प्रत्येक कंपनी के स्टॉक प्राइस — को दूसरों से स्वतंत्र रूप से रिस्केल करता है.

KMeans और make_pipeline पहले से आपके लिए इम्पोर्ट किए गए हैं.

निर्देश

100 XP
  • sklearn.preprocessing से Normalizer इम्पोर्ट करें.
  • Normalizer का एक इंस्टेंस बनाएँ और उसे normalizer नाम दें.
  • KMeans का एक इंस्टेंस बनाएँ और 10 क्लस्टर्स सेट करके उसे kmeans नाम दें.
  • make_pipeline() का उपयोग करके pipeline नाम की एक पाइपलाइन बनाएँ जो normalizer और kmeans को चेन करे.
  • movements ऐरे पर पाइपलाइन को फिट करें.