1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. scikit-learn के साथ Supervised Learning

Connected

Bài tập

ओवरफिटिंग और अंडरफिटिंग

मॉडल की complexity को समझना, supervised learning के प्रदर्शन का आकलन करने का एक बढ़िया तरीका है. आपका लक्ष्य ऐसा मॉडल बनाना है जो फीचर्स और target वैरिएबल के बीच संबंध को समझ सके, और नई observations पर भी अच्छा generalize कर सके.

churn_df डेटासेट से training और test सेट बनाए जा चुके हैं और X_train, X_test, y_train, और y_test के रूप में प्रीलोडेड हैं.

इसके अलावा, KNeighborsClassifier और numpy को np नाम से आपके लिए इम्पोर्ट किया गया है.

Hướng dẫn

100 XP
  • neighbors को 1 से शुरू होकर 12 तक (शामिल) मानों वाले numpy array के रूप में बनाइए.
  • KNeighborsClassifier को instantiate कीजिए, जिसमें पड़ोसियों की संख्या neighbor iterator के बराबर हो.
  • मॉडल को training डेटा पर fit कीजिए.
  • .score() मेथड का उपयोग करके training सेट और test सेट के लिए accuracy scores अलग-अलग निकालिए, और परिणामों को क्रमशः train_accuracies और test_accuracies dictionaries में, index के रूप में neighbor iterator का उपयोग करते हुए, असाइन कीजिए.