1. Learn
  2. /
  3. कोर्स
  4. /
  5. scikit-learn के साथ Supervised Learning

Connected

अभ्यास

श्रेणीबद्ध फीचरों के साथ रिग्रेशन

अब जब आपने music_dummies बना लिया है, जिसमें हर गाने के जॉनर के लिए बायनरी फीचर हैं, तो गाने की लोकप्रियता का अनुमान लगाने के लिए एक रीज रिग्रेशन मॉडल बनाने का समय है.

आपके लिए music_dummies पहले से लोड है, साथ ही Ridge, cross_val_score, numpy as np, और kf नाम से एक KFold ऑब्जेक्ट भी उपलब्ध है.

मॉडल का आकलन औसत RMSE निकालकर किया जाएगा। लेकिन पहले, आपको हर फोल्ड के स्कोर को पॉजिटिव में बदलना होगा और उनका स्क्वेयर रूट लेना होगा। यह मेट्रिक हमारे मॉडल की भविष्यवाणियों की औसत त्रुटि को दिखाती है, इसलिए इसे टारगेट वैल्यू—"popularity"—के स्टैंडर्ड डिविएशन से तुलना किया जा सकता है.

निर्देश

100 XP
  • music_dummies के सभी फीचर लेकर X बनाएँ, और "popularity" कॉलम को लेकर y बनाएँ.
  • alpha को 0.2 सेट करते हुए एक रीज रिग्रेशन मॉडल इनस्टैंशिएट करें.
  • रीज मॉडल का उपयोग करते हुए X और y पर क्रॉस-वैलिडेशन चलाएँ, जहाँ cv को kf रखें, और स्कोरिंग मेट्रिक के रूप में negative mean squared error का उपयोग करें.
  • नकारात्मक scores को पॉजिटिव में बदलकर और उनका स्क्वेयर रूट लेकर RMSE वैल्यूज़ प्रिंट करें.