1. Learn
  2. /
  3. Cursuri
  4. /
  5. Machine Learning pentru finanțe în Python

Connected

exercițiu

Corelații

Este util să verifici corelațiile înainte de a construi modele de învățare automată, deoarece poți vedea care caracteristici corelează cel mai puternic cu ținta. Se folosește adesea coeficientul de corelație Pearson, care detectează doar relații liniare. Se presupune în mod obișnuit că datele sunt distribuite normal, lucru pe care îl poți „estima vizual" din histograme. Variabilele puternic corelate au un coeficient de corelație Pearson apropiat de 1 (corelație pozitivă) sau de -1 (corelație negativă). O valoare apropiată de 0 înseamnă că cele două variabile nu sunt corelate liniar.

Dacă folosim aceleași intervale de timp pentru variațiile anterioare și cele viitoare ale prețului, putem observa dacă prețul acțiunii revine la medie (oscilează) sau urmează un trend (crește dacă a crescut recent).

Instrucțiuni

100 XP

Folosind DataFrame-ul lng_df și coloana Adj_Close:

  • Creează prețul viitor pe 5 zile (ca 5d_future_close) cu funcția .shift(-5) din pandas.
  • Aplică pct_change(5) pe 5d_future_close și Adj_Close pentru a crea variația procentuală viitoare a prețului pe 5 zile (5d_close_future_pct), respectiv variația procentuală curentă a prețului pe 5 zile (5d_close_pct).
  • Examinează corelațiile dintre cele două coloane de variație procentuală pe 5 zile folosind .corr() pe lng_df.
  • Folosind plt.scatter(), creează un grafic de dispersie pentru 5d_close_pct față de 5d_close_future_pct.