1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 범주형 데이터 다루기

Connected

연습 문제

pandas 함수를 효율적으로 사용하기

사용자가 선택한 변수에 따라 요약 통계를 계산하는 Python 애플리케이션을 만들고 있어요. 전체 데이터셋은 꽤 큽니다. 지금은 그 일부를 adult로 미리 불러와 코드를 구성하고 있어요. 재사용 가능한 프로세스를 만들면서, GroupBy 객체를 가장 효율적으로 설정하는 방법을 고려해 주세요.

지침

100 XP
  • 사용자 선택 변수 두 개의 이름 "Education"와 "Above/Below 50k"로 리스트를 만드세요.
  • user_list를 그룹화 변수로 사용해 GroupBy 객체 gb를 만드세요.
  • 영상에서 다룬 가장 효율적인 방법으로 각 그룹에 대해 "Hours/Week"의 평균을 계산하세요.