1. Learn
  2. /
  3. คอร์ส
  4. /
  5. scikit-learn के साथ Supervised Learning

Connected

แบบฝึกหัด

RandomizedSearchCV के साथ हाइपरपैरामीटर ट्यूनिंग

जैसा कि आपने देखा, GridSearchCV कम्प्यूटेशन के हिसाब से महंगा पड़ सकता है, खासकर तब जब आप बहुत बड़े हाइपरपैरामीटर स्पेस में खोज रहे हों. ऐसे में आप RandomizedSearchCV इस्तेमाल कर सकते हैं, जो दी गई probability distributions से हाइपरपैरामीटर सेटिंग्स की एक निश्चित संख्या को टेस्ट करता है.

diabetes_df से training और test सेट आपके लिए पहले से X_train, X_test, y_train, और y_test के रूप में लोड हैं, जहाँ target "diabetes" है. एक logistic regression मॉडल बनाया जा चुका है और logreg के रूप में स्टोर है, साथ ही KFold वैरिएबल kf के रूप में स्टोर है.

आप हाइपरपैरामीटर्स की एक रेंज परिभाषित करेंगे और sklearn.model_selection से इम्पोर्ट किए गए RandomizedSearchCV का उपयोग करके इन विकल्पों में से बेहतरीन हाइपरपैरामीटर ढूँढ़ेंगे.

คำแนะนำ

100 XP
  • params बनाएँ: penalty के लिए "l1" और "l2" जोड़ें, C को 0.1 और 1.0 के बीच 50 float मानों की रेंज पर सेट करें, और class_weight को या तो "balanced" या एक dictionary {0:0.8, 1:0.2} पर सेट करें.
  • Randomized Search CV ऑब्जेक्ट बनाएँ, जिसमें मॉडल और पैरामीटर्स पास करें, और cv को kf के बराबर सेट करें.
  • logreg_cv को training डेटा पर fit करें.
  • मॉडल के सर्वश्रेष्ठ पैरामीटर्स और accuracy स्कोर प्रिंट करें.