Přetrénování a podtrénování

Sledování složitosti modelu je skvělý způsob, jak hodnotit výkon v rámci supervised learningu. Cílem je vytvořit model, který dokáže zachytit vztah mezi příznaky a cílovou proměnnou a zároveň dobře zobecňovat na nová pozorování.

Trénovací a testovací sady byly vytvořeny z datasetu churn_df a jsou připraveny jako X_train, X_test, y_train a y_test.

Navíc jsou pro tebe naimportovány KNeighborsClassifier a numpy jako np.

Vytvoř proměnnou neighbors jako numpy pole hodnot od 1 včetně do 12 včetně.
Vytvoř instanci KNeighborsClassifier, kde počet sousedů odpovídá iterátoru neighbor.
Natrénuj model na trénovacích datech.
Vypočítej skóre přesnosti pro trénovací a testovací sadu zvlášť pomocí metody .score() a výsledky ulož do slovníků train_accuracies a test_accuracies s použitím iterátoru neighbor jako indexu.

cvičení

Přetrénování a podtrénování

Pokyny

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení