1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 데이터 시각화 개선하기

Connected

연습 문제

가장 시장 친화적인 주는 어디일까요?

농산물 직거래 장터 데이터를 탐색하던 중, 주(state) 단위로 집계하면 어떤 패턴이 나타날지 궁금해졌어요. 어떤 주는 다른 주보다 더 시장 친화적일까요? 이를 살펴보기 위해 데이터를 주별로 그룹화한 뒤, 시장 수의 로그 변환값(log_markets)과 주 인구의 로그 변환값(log_pop)을 구했어요.

markets_and_pop = (markets
    .groupby('state', as_index = False)
    .agg({
       'name': lambda d: log(len(d)),
       'state_pop': lambda d: log(d.iloc[0]) })
    .rename(columns = {
        'name': 'log_markets', 
        'state_pop': 'log_pop' }))

시각화할 때는 회귀 플롯으로 시장 수와 인구 수 사이의 ‘일반적인’ 관계를 파악하고, 텍스트 스캐터를 함께 사용해 눈에 띄는 이상치를 빠르게 식별해 보려고 해요.

지침

100 XP
  • markets_and_pop DataFrame의 각 행을 순회하세요.
  • 산점도 점 옆에 주석을 배치하세요.
  • 주석 글자 크기를 10포인트로 줄이세요.