1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w finansach z Pythonem

Connected

ćwiczenie

Korelacje

Warto sprawdzić korelacje przed zbudowaniem modeli uczenia maszynowego – pozwala to zobaczyć, które cechy najsilniej korelują z celem. Często stosuje się współczynnik korelacji Pearsona, który wykrywa wyłącznie zależności liniowe. Zwykle zakłada się, że dane mają rozkład normalny, co można wstępnie ocenić na podstawie histogramów. Silnie skorelowane zmienne mają współczynnik korelacji Pearsona bliski 1 (korelacja dodatnia) lub -1 (korelacja ujemna). Wartość bliska 0 oznacza brak liniowej zależności między dwiema zmiennymi.

Jeśli użyjemy tych samych przedziałów czasowych dla poprzednich i przyszłych zmian cen, możemy sprawdzić, czy kurs akcji wykazuje tendencję do powrotu do średniej (waha się wokół pewnego poziomu) czy podąża za trendem (rośnie, jeśli ostatnio rósł).

Instrukcje

100 XP

Korzystając z DataFrame lng_df i kolumny Adj_Close:

  • Utwórz cenę przyszłą z wyprzedzeniem 5 dni (jako 5d_future_close) za pomocą .shift(-5) z biblioteki pandas.
  • Użyj pct_change(5) na kolumnach 5d_future_close i Adj_Close, aby obliczyć przyszłą 5-dniową procentową zmianę ceny (5d_close_future_pct) oraz bieżącą 5-dniową procentową zmianę ceny (5d_close_pct).
  • Sprawdź korelacje między obiema kolumnami 5-dniowych procentowych zmian cen, wywołując .corr() na lng_df.
  • Za pomocą plt.scatter() utwórz wykres punktowy przedstawiający 5d_close_pct względem 5d_close_future_pct.