1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Finance in Python

Connected

Cvičení

Prozkoumej data pomocí EDA

Nejdřív se podíváme na data zblízka. Kdykoli začínáme projekt strojového učení, je potřeba nejprve provést průzkumnou analýzu dat (EDA), abychom se s daty dobře seznámili. Patří sem například:

  • grafy surových dat
  • histogramy
  • a další…

Já obvykle začínám právě grafy surových dat a histogramy. Díky nim pochopíme rozložení dat. Pokud jde o normální rozdělení, můžeme využít parametrické statistické metody.

Do pandas DataFramů jsou pro tebe načteny dva akciové tituly: lng_df a spy_df (LNG a SPY). Prohlédni si je pomocí .head(). Jako vstupy pro algoritmy strojového učení budeme používat závěrečné ceny a postupně i objemy obchodů.

Poznámka: Pokaždé, když chceme vytvořit nový graf, zavoláme plt.clf() nebo f = plt.figure().

Pokyny

100 XP
  • Vypiš prvních 5 řádků obou DataFramů (lng_df a spy_df) a prohlédni si jejich obsah.
  • Pomocí pandas vykresli grafy časových řad surových dat pro 'SPY' a 'LNG' s upravenou závěrečnou cenou ('Adj_Close') – v .plot() nastav legend=True.
  • Pomocí plt.show() zobraz graf časové řady (matplotlib.pyplot je naimportován jako plt).
  • Pomocí pandas a matplotlib vytvoř histogram procentuální změny upravené závěrečné ceny za 1 den (použij .pct_change()) pro SPY a LNG.