1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Finance in Python

Connected

Cvičení

Vytvoření příznaků a cílů

Příznaky a cíle jsou téměř připravené pro strojové učení – máme příznaky z aktuálních cenových změn (5d_close_pct) a indikátory (klouzavé průměry a RSI) a vytvořili jsme cíle z budoucích cenových změn (5d_close_future_pct). Teď je potřeba rozdělit je do samostatných numpy polí, abychom je mohli předat algoritmům strojového učení.

Naše indikátory způsobují, že na začátku DataFrame chybí některé hodnoty – je to důsledek jejich výpočtu. Tato data bychom mohli doplnit zpětně, nahradit jednou hodnotou, nebo příslušné řádky odstranit. Odstranění řádků je dobrá volba, aby algoritmy strojového učení nebyly zmatené zpětně doplněnými nebo nulami vyplněnými daty. Pandas nabízí funkci .dropna(), pomocí které odstraníme všechny řádky s chybějícími hodnotami.

Pokyny

100 XP
  • Odstraň chybějící hodnoty z lng_df pomocí .dropna() z pandas.
  • Vytvoř proměnnou obsahující naše cíle, tedy hodnoty '5d_close_future_pct'.
  • Vytvoř DataFrame obsahující cíle (5d_close_future_pct) i příznaky (obsažené v existujícím seznamu feature_names), abychom mohli zkontrolovat korelace.