1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w finansach z Pythonem

Connected

ćwiczenie

Tworzenie cech i wartości docelowych

Cechy i wartości docelowe są już prawie gotowe do uczenia maszynowego – mamy cechy oparte na bieżących zmianach cen (5d_close_pct) oraz wskaźniki (średnie kroczące i RSI), a także wartości docelowe w postaci przyszłych zmian cen (5d_close_future_pct). Teraz trzeba podzielić te dane na osobne tablice numpy, aby można było przekazać je do algorytmów uczenia maszynowego.

Nasze wskaźniki powodują pojawienie się brakujących wartości na początku DataFrame ze względu na sposób ich obliczania. Można by wypełnić te braki danymi z kolejnych wierszy, zastąpić je pojedynczą wartością lub po prostu usunąć odpowiednie wiersze. Usunięcie wierszy to dobry wybór – algorytmy uczenia maszynowego nie będą wtedy mylone przez dane uzupełnione wstecznie ani wypełnione zerami. Pandas udostępnia funkcję .dropna(), której użyjemy do usunięcia wierszy z brakującymi wartościami.

Instrukcje

100 XP
  • Usuń brakujące wartości z lng_df za pomocą .dropna() z biblioteki pandas.
  • Utwórz zmienną zawierającą wartości docelowe, czyli kolumnę '5d_close_future_pct'.
  • Utwórz DataFrame zawierający zarówno wartości docelowe (5d_close_future_pct), jak i cechy (zawarte w istniejącej liście feature_names), aby sprawdzić korelacje.