1. Learn
  2. /
  3. Courses
  4. /
  5. pandas로 효율적인 코드 작성하기

Connected

Exercise

결측값 식별하기

결측값을 대체하기 전에 가장 먼저 할 일은 데이터에 결측값이 있는지, 있다면 어느 그룹에서 발생했는지 확인하는 것입니다.

수업에서 사용했던 같은 restaurant_data 데이터에서, 한 직원이 실수로 65개의 테이블에 남겨진 팁을 지워 버렸습니다. 우리가 알아볼 질문은 흡연자가 있던 테이블과 비흡연자만 있던 테이블 중 각각에서 결측값이 몇 개 발생했는지입니다.

여러분의 작업은 두 데이터셋을 smoker 변수에 따라 그룹화하고, 각 그룹에서 결측이 아닌 값의 개수를 센 다음 그 차이를 계산하는 것입니다.

이번 연습에서는 수업에서 배운 개념을 연습하기 위해 팁 데이터를 임시로 대체해 봅니다. 다만 윤리적 관점에서 실제 재무 데이터는 임의로 대체하면 안 되며, 사기에 해당할 수 있습니다.

Instructions

100 XP
  • 흡연 상태에 따라 데이터를 그룹화하세요.
  • 각 그룹에서 결측이 아닌 값의 개수를 계산하세요.
  • 각 그룹의 결측값 개수를 출력하세요.