1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 금융 분야 Machine Learning

Connected

연습 문제

상관관계 확인하기

첫 Machine Learning 모델을 학습하기 전에, 특성과 타깃 간의 상관관계를 살펴보겠습니다. 이상적으로는 특성과 타깃 사이의 상관관계가 크게(1 또는 -1에 가깝게) 나오면 좋습니다. 상관관계를 확인하면 특성을 조정해 상관관계를 최대화하는 데 도움이 됩니다(예: talib 함수의 timeperiod 인자를 조정). 또한 타깃과 상관관계가 거의 없는 특성을 제거하는 데도 유용합니다.

상관행렬을 손쉽게 시각화하려면 seaborn의 heatmap() 함수를 사용할 수 있습니다. 이 함수는 상관행렬을 첫 번째 인자로 받고, 다양한 옵션을 제공합니다. 주석을 표시해 주는 annot 옵션을 확인해 보세요 — 주석을 켜는 데 도움이 됩니다.

지침 1/2

undefined XP
    1
    2
  • 지난 연습 문제에서 계산한 상관행렬(corr)의 히트맵을 그리세요 (seaborn은 sns로 임포트되어 있습니다).
  • sns.heatmap()의 annot=True 옵션으로 주석을 켭니다. 글꼴 크기는 이미 annot_kws = {"size": 14}로 설정되어 있습니다.
  • plt.show()로 플롯을 표시하세요.