1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning with scikit-learn

Connected

cvičení

Přetrénování a podtrénování

Sledování složitosti modelu je skvělý způsob, jak hodnotit výkon v rámci supervised learningu. Cílem je vytvořit model, který dokáže zachytit vztah mezi příznaky a cílovou proměnnou a zároveň dobře zobecňovat na nová pozorování.

Trénovací a testovací sady byly vytvořeny z datasetu churn_df a jsou připraveny jako X_train, X_test, y_train a y_test.

Navíc jsou pro tebe naimportovány KNeighborsClassifier a numpy jako np.

Pokyny

100 XP
  • Vytvoř proměnnou neighbors jako numpy pole hodnot od 1 včetně do 12 včetně.
  • Vytvoř instanci KNeighborsClassifier, kde počet sousedů odpovídá iterátoru neighbor.
  • Natrénuj model na trénovacích datech.
  • Vypočítej skóre přesnosti pro trénovací a testovací sadu zvlášť pomocí metody .score() a výsledky ulož do slovníků train_accuracies a test_accuracies s použitím iterátoru neighbor jako indexu.