1. 학습
  2. /
  3. 강의
  4. /
  5. pandas를 이용한 데이터 다루기

Connected

연습 문제

중복 데이터 제거하기

정확한 계산을 위해서는 중복 데이터를 제거하는 것이 매우 중요합니다. 같은 항목이 여러 번 집계되는 상황을 방지할 수 있기 때문입니다. 이번 연습 문제에서는 sales의 고유값을 활용해 새로운 DataFrame을 만들어 보겠습니다.

sales를 사용할 수 있으며, pandas는 pd로 임포트되어 있습니다.

지침

100 XP
  • sales에서 store와 type 쌍이 중복된 행을 제거하고 store_types로 저장한 후 앞부분을 출력하세요.
  • sales에서 store와 department 쌍이 중복된 행을 제거하고 store_depts로 저장한 후 앞부분을 출력하세요.
  • is_holiday 열을 사용해 공휴일인 행만 선택하고, 중복된 date를 제거하여 holiday_dates로 저장하세요.
  • holiday_dates의 date 열을 선택하고 출력하세요.