1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में Tree-Based Models के साथ Machine Learning

Connected

अभ्यास

सर्वोत्तम ट्री का मूल्यांकन करें

इस अभ्यास में, आप grid_dt के सर्वोत्तम मॉडल का टेस्ट सेट ROC AUC स्कोर मूल्यांकित करेंगे.

ऐसा करने के लिए, आप पहले टेस्ट सेट की प्रत्येक ऑब्ज़र्वेशन के लिए पॉज़िटिव लेबल प्राप्त होने की प्रायिकता निर्धारित करेंगे। sklearn क्लासिफायर की predict_proba() मेथड से आप 2D एरे निकाल सकते हैं, जिसमें कॉलम-वाइज क्रमशः नेगेटिव और पॉज़िटिव क्लास-लेबल्स की प्रायिकताएँ होती हैं.

डेटासेट आपके लिए पहले से लोड और प्रोसेस किया गया है (न्यूमेरिकल फीचर्स को स्टैंडर्डाइज़ किया गया है); इसे 80% ट्रेन और 20% टेस्ट में बाँटा गया है। X_test, y_test आपके वर्कस्पेस में उपलब्ध हैं। साथ ही, हमने पिछले अभ्यास में आपने जो GridSearchCV ऑब्जेक्ट grid_dt बनाया था, उसका प्रशिक्षित संस्करण भी लोड कर दिया है। ध्यान दें कि grid_dt को इस प्रकार प्रशिक्षित किया गया था:

grid_dt.fit(X_train, y_train)

निर्देश

100 XP
  • sklearn.metrics से roc_auc_score इम्पोर्ट करें.

  • grid_dt से .best_estimator_ एट्रिब्यूट निकालकर उसे best_model में असाइन करें.

  • टेस्ट सेट पर पॉज़िटिव क्लास प्राप्त करने की प्रायिकताएँ y_pred_proba के रूप में प्रेडिक्ट करें.

  • best_model का टेस्ट सेट ROC AUC स्कोर test_roc_auc गणना करें.