RandomizedSearchCV के साथ हाइपरपैरामीटर ट्यूनिंग

जैसा कि आपने देखा, GridSearchCV कम्प्यूटेशन के हिसाब से महंगा पड़ सकता है, खासकर तब जब आप बहुत बड़े हाइपरपैरामीटर स्पेस में खोज रहे हों. ऐसे में आप RandomizedSearchCV इस्तेमाल कर सकते हैं, जो दी गई probability distributions से हाइपरपैरामीटर सेटिंग्स की एक निश्चित संख्या को टेस्ट करता है.

diabetes_df से training और test सेट आपके लिए पहले से X_train, X_test, y_train, और y_test के रूप में लोड हैं, जहाँ target "diabetes" है. एक logistic regression मॉडल बनाया जा चुका है और logreg के रूप में स्टोर है, साथ ही KFold वैरिएबल kf के रूप में स्टोर है.

आप हाइपरपैरामीटर्स की एक रेंज परिभाषित करेंगे और sklearn.model_selection से इम्पोर्ट किए गए RandomizedSearchCV का उपयोग करके इन विकल्पों में से बेहतरीन हाइपरपैरामीटर ढूँढ़ेंगे.

params बनाएँ: penalty के लिए "l1" और "l2" जोड़ें, C को 0.1 और 1.0 के बीच 50 float मानों की रेंज पर सेट करें, और class_weight को या तो "balanced" या एक dictionary {0:0.8, 1:0.2} पर सेट करें.
Randomized Search CV ऑब्जेक्ट बनाएँ, जिसमें मॉडल और पैरामीटर्स पास करें, और cv को kf के बराबर सेट करें.
logreg_cv को training डेटा पर fit करें.
मॉडल के सर्वश्रेष्ठ पैरामीटर्स और accuracy स्कोर प्रिंट करें.

แบบฝึกหัด

RandomizedSearchCV के साथ हाइपरपैरामीटर ट्यूनिंग

คำแนะนำ

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}แบบฝึกหัด

คำแนะนำ

แบบฝึกหัด