1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python으로 데이터 정제하기

Connected

exercise

숫자형 데이터일까요, 아니면 ... ?

이번 연습 문제와 이 장 전체에서는 샌프란시스코의 자전거 공유 데이터인 ride_sharing을 사용해요. 이 데이터에는 시작/종료 대여소, 이동 시간, 그리고 자전거 공유 서비스의 일부 사용자 정보가 들어 있어요.

user_type 열은 사용자가 무료로 이용했는지에 대한 정보를 담고 있으며, 값은 다음과 같아요.

  • 무료 이용자는 1.
  • 이용 건당 결제는 2.
  • 월 구독자는 3.

이번에는 .info()를 사용해 ride_sharing의 정보를 출력하고, 잘못된 데이터 유형이 데이터셋 분석을 어떻게 왜곡할 수 있는지 직접 확인해 보세요. pandas 패키지는 pd로 임포트되어 있어요.

Instruktioner 1 / 3

undefined XP
    1
    2
    3
  • ride_sharing의 정보를 출력하세요.
  • .describe()를 사용해 ride_sharing의 user_type 열에 대한 요약 통계를 출력하세요.