1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python으로 데이터 정제하기

Connected

exercise

문자열을 더하고 숫자를 이어 붙이는 문제

이전 연습 문제에서는 user_type에 적합한 데이터 타입이 category임을 확인하고, 이를 변환해 user_type 분포를 파악할 수 있는 통계 요약을 추출했어요.

또 다른 흔한 데이터 타입 문제는 숫자여야 할 값을 문자열로 가져오는 경우예요. 이렇게 되면 합계나 곱셈 같은 수학 연산이 숫자 계산이 아니라 문자열 이어 붙이기로 처리됩니다.

이번 연습 문제에서는 문자열 열 duration을 int 타입으로 변환할 거예요. 그 전에, pandas가 숫자로 인식할 수 있도록 열에서 "minutes"를 먼저 제거해야 해요. pandas 패키지는 pd로 임포트되어 있어요.

Instruktioner

100 XP
  • .strip() 메서드를 사용해 duration에서 "minutes"를 제거하고 duration_trim 열에 저장하세요.
  • duration_trim을 int로 변환해 duration_time 열에 저장하세요.
  • duration_time의 데이터 타입이 이제 int인지 확인하는 assert 문을 작성하세요.
  • 평균 이용 시간을 출력하세요.