1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w finansach z Pythonem

Connected

ćwiczenie

Optymalizacja n_neighbors

Mamy już przeskalowane dane, więc możemy wypróbować model KNN. Aby zmaksymalizować jego wydajność, warto dostroić hiperparametry modelu. W algorytmie k najbliższych sąsiadów mamy tylko jeden hiperparametr: n, czyli liczbę sąsiadów. Ustawiamy go podczas tworzenia modelu za pomocą KNeighborsRegressor. Argument odpowiadający za liczbę sąsiadów to n_neighbors.

Spróbujemy przetestować zakres wartości obejmujący ustawienie dające najlepszą wydajność. Zazwyczaj zaczynamy od 2 sąsiadów i zwiększamy tę liczbę, aż metryka oceny zacznie spadać. Użyjemy wartości R\(^2\) zwracanej przez metodę .score() na zbiorze testowym (scaled_test_features i test_targets), aby zoptymalizować n. Na podstawie wyników na zbiorze testowym wybierzemy najlepsze n.

Instrukcje

100 XP
  • Przejdź pętlą przez wartości od 2 do 12 dla n i ustaw je jako n_neighbors w modelu knn.
  • Dopasuj model do danych treningowych (scaled_train_features i train_targets).
  • Wyświetl wartości R\(^2\) za pomocą metody .score() modelu knn dla zbiorów treningowego i testowego, a następnie zanotuj najlepszy wynik na zbiorze testowym.