1. 학습
  2. /
  3. 강의
  4. /
  5. pandas로 데이터 재구조화하기

Connected

연습 문제

패스트푸드 줄이기, 부탁해요!

또 월요일이네요! 이번에는 새로운 프로젝트를 시작해요 — 여러 해에 걸친 비만율 변화를 분석하는 작업이에요. 다양한 국가와 연도에 따른 비만율(%)이 담긴 obesity라는 데이터셋이 있고, 생물학적 성별로도 구분되어 있어요.

주요 목표는 연도·성별별 평균 비만율과 국가·성별별 평균 비만율을 구하는 것이에요. 또한, 연도 간 차이도 계산하려고 해요.

데이터셋에 다중 인덱스가 있는 것을 확인했으니, 목표를 달성하려면 레벨을 unstack해야 한다는 걸 알 수 있어요.

obesity DataFrame은 세션에 준비되어 있어요.

지침 1/3

undefined XP
  • 1

    첫 번째 레벨을 unstack하여 obesity DataFrame의 형태를 바꾼 뒤, 열의 평균값을 구하세요.

  • 2

    obesity의 두 번째 레벨을 unstack하고 열의 평균값을 구해 obesity_mean DataFrame을 정의하세요.

  • 3

    마지막으로 obesity DataFrame의 세 번째 레벨을 unstack한 다음, .diff()를 사용해 열 간 차이를 계산하세요.