ओवरफिटिंग और अंडरफिटिंग

मॉडल की complexity को समझना, supervised learning के प्रदर्शन का आकलन करने का एक बढ़िया तरीका है. आपका लक्ष्य ऐसा मॉडल बनाना है जो फीचर्स और target वैरिएबल के बीच संबंध को समझ सके, और नई observations पर भी अच्छा generalize कर सके.

churn_df डेटासेट से training और test सेट बनाए जा चुके हैं और X_train, X_test, y_train, और y_test के रूप में प्रीलोडेड हैं.

इसके अलावा, KNeighborsClassifier और numpy को np नाम से आपके लिए इम्पोर्ट किया गया है.

neighbors को 1 से शुरू होकर 12 तक (शामिल) मानों वाले numpy array के रूप में बनाइए.
KNeighborsClassifier को instantiate कीजिए, जिसमें पड़ोसियों की संख्या neighbor iterator के बराबर हो.
मॉडल को training डेटा पर fit कीजिए.
.score() मेथड का उपयोग करके training सेट और test सेट के लिए accuracy scores अलग-अलग निकालिए, और परिणामों को क्रमशः train_accuracies और test_accuracies dictionaries में, index के रूप में neighbor iterator का उपयोग करते हुए, असाइन कीजिए.

Bài tập

ओवरफिटिंग और अंडरफिटिंग

Hướng dẫn

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn

Bài tập