1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Finance in Python

Connected

Cvičení

Optimalizace n_neighbors

Teď, když máme škálovaná data, můžeme vyzkoušet model KNN. Abychom dosáhli co nejlepšího výkonu, je potřeba doladit hyperparametry modelu. U algoritmu k nejbližších sousedů máme jen jeden hyperparametr: n, tedy počet sousedů. Tento hyperparametr nastavíme při vytváření modelu pomocí KNeighborsRegressor. Argument pro počet sousedů se jmenuje n_neighbors.

Chceme vyzkoušet rozsah hodnot, který pokryje nastavení s nejlepším výkonem. Obvykle začínáme se 2 sousedy a zvyšujeme hodnotu, dokud naše metrika přestane růst. Ke optimalizaci n použijeme hodnotu R\(^2\) z metody .score() na testovací sadě (scaled_test_features a test_targets). Nejlepší n určíme na základě skóre na testovací sadě.

Pokyny

100 XP
  • Projdi hodnoty od 2 do 12 pro n a nastav je jako n_neighbors v modelu knn.
  • Natrénuj model na trénovacích datech (scaled_train_features a train_targets).
  • Vypiš hodnoty R\(^2\) pomocí metody .score() modelu knn pro trénovací i testovací sadu a zaznamenej si nejlepší skóre na testovací sadě.