1. Learn
  2. /
  3. कोर्स
  4. /
  5. scikit-learn के साथ Supervised Learning

Connected

अभ्यास

फीचर्स बनाना

इस अध्याय में, आप sales_df नाम के एक डेटासेट के साथ काम करेंगे, जिसमें अलग-अलग मीडिया प्रकारों पर विज्ञापन अभियान के खर्च की जानकारी होती है, और संबंधित अभियान से बिक्री में उत्पन्न डॉलर की संख्या दी होती है. यह डेटासेट आपके लिए पहले से लोड किया गया है. शुरुआती दो पंक्तियाँ इस प्रकार हैं:

     tv        radio      social_media    sales
1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

आप बिक्री का मान प्रेडिक्ट करने के लिए विज्ञापन खर्च को फीचर्स के रूप में उपयोग करेंगे, और शुरुआत में "radio" कॉलम के साथ काम करेंगे. हालाँकि, किसी भी प्रेडिक्शन से पहले आपको फीचर और टारगेट एरे बनाने होंगे, और उन्हें scikit-learn के सही फॉर्मेट में रीशेप करना होगा.

निर्देश

100 XP
  • X बनाएँ: sales_df DataFrame के "radio" कॉलम के मानों से एक एरे.
  • y बनाएँ: sales_df DataFrame के "sales" कॉलम के मानों से एक एरे.
  • X को एक दो-आयामी NumPy एरे में रीशेप करें.
  • X और y का shape प्रिंट करें.