1. Nauka
  2. /
  3. Kursy
  4. /
  5. Projektowanie przepływów pracy uczenia maszynowego w Pythonie

Connected

ćwiczenie

Dostrajanie rozmiaru okna

Chcesz samodzielnie sprawdzić, że optymalny rozmiar okna dla zbioru danych arytmii wynosi 50. Otrzymujesz ten zbiór danych jako ramkę danych pandas o nazwie arrh i chcesz użyć podzbioru danych do momentu czasowego t_now. Dane testowe są dostępne jako X_test i y_test. Przetestujesz różne rozmiary okien – od 10 do 100 – dopasowując do każdego z nich naiwny klasyfikator Bayesa, oceniając jego wynik F1 na danych testowych, a następnie wybierzesz najlepiej działający rozmiar okna. Masz też dostęp do numpy jako np, a funkcja f1_score() została już zaimportowana. Na koniec – pusta lista accuracies jest już zainicjowana, abyś mógł zapisywać w niej dokładności poszczególnych okien.

Instrukcje

100 XP
  • Zdefiniuj indeks przesuwanego okna o rozmiarze w_size kończącego się w t_now, używając metody .loc().
  • Skonstruuj X z przesuwanego okna, usuwając kolumnę class. Zachowaj tę ostatnią kolumnę jako y.
  • Dopasuj naiwny klasyfikator Bayesa do X i y, a następnie użyj go do przewidzenia etykiet dla danych testowych X_test.
  • Oblicz wynik F1 tych predykcji dla każdego rozmiaru okna i znajdź najlepiej działający rozmiar okna.