1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 하는 탐색적 데이터 분석

Connected

연습 문제

변수 관계 시각화하기

이전 연습 문제에서 marriage_duration(결혼 기간)이 길수록 num_kids 열로 표현되는 자녀 수가 더 많은 경향이 있음을 보셨을 거예요. marriage_duration와 num_kids 변수 간의 상관계수는 0.45입니다.

이번 연습에서는 이 두 변수의 관계를 산점도로 시각화해 보겠습니다. pandas는 pd로, matplotlib.pyplot은 plt로, Seaborn은 sns로 불러와져 있습니다. 데이터셋 이름은 divorce입니다.

지침

100 XP
  • x축에 marriage_duration, y축에 num_kids를 놓은 산점도를 만드세요.