1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python 도구 상자

Connected

演習

타임스탬프 데이터에 리스트 컴프리헨션 적용하기

이제 이 장에서 배운 내용을 활용해 간단한 데이터 추출 문제를 풀어 보겠습니다. 이번 연습에서는 데이터 구조인 pandas Series도 간단히 살펴봅니다. 자세한 설명은 생략하지만, pandas DataFrame에서 데이터를 분석할 때 자주 다루게 되는 자료형이라는 점만 기억하시면 됩니다. DataFrame의 각 컬럼은 Series라고 불리는 1차원 배열로 볼 수 있어요.

이번 연습에서는 리스트 컴프리헨션을 사용해 타임스탬프가 있는 Twitter 데이터에서 시간을 추출합니다. pandas 패키지는 pd로 임포트되어 있고, 파일 'tweets.csv'는 df DataFrame으로 불러와 두었습니다.

指示

100 XP
  • df에서 컬럼 'created_at'을 추출해 tweet_time에 할당하세요. 재미있는 사실: 여기서 tweet_time에 담기는 값은 Series 자료형이에요!
  • tweet_time의 각 행에서 시간을 추출하는 리스트 컴프리헨션을 작성하세요. 각 행은 타임스탬프를 나타내는 문자열이며, 문자열의 12번째부터 19번째 문자를 접근해 시간을 추출합니다. 반복 변수로는 entry를 사용하고, 결과를 tweet_clock_time에 할당하세요. Python은 0부터 인덱싱한다는 점을 기억하세요!