1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Hộp Công Cụ Python

Connected

Bài tập

List comprehension cho dữ liệu có dấu thời gian

Bây giờ bạn sẽ vận dụng những gì đã học trong chương này để giải một bài toán trích xuất dữ liệu đơn giản. Trong bài này, bạn cũng sẽ làm quen với một cấu trúc dữ liệu là Series của pandas. Chúng ta sẽ không đi sâu ở đây, nhưng bạn cần biết rằng đây là cấu trúc dữ liệu bạn sẽ dùng rất thường xuyên khi phân tích dữ liệu từ pandas DataFrame. Bạn có thể coi các cột của DataFrame là các mảng một chiều gọi là Series.

Trong bài tập này, bạn sẽ dùng list comprehension để trích xuất thời gian từ dữ liệu Twitter có dấu thời gian. Gói pandas đã được import dưới tên pd và tệp 'tweets.csv' đã được nạp vào DataFrame df để bạn sử dụng.

Hướng dẫn

100 XP
  • Trích xuất cột 'created_at' từ df và gán kết quả cho tweet_time. Thông tin thú vị: cột được trích xuất trong tweet_time ở đây là một cấu trúc dữ liệu Series!
  • Tạo một list comprehension để trích xuất thời gian từ mỗi hàng trong tweet_time. Mỗi hàng là một chuỗi biểu diễn timestamp, và bạn sẽ truy cập vào ký tự thứ 12 đến 19 trong chuỗi để trích xuất thời gian. Dùng entry làm biến vòng lặp và gán kết quả cho tweet_clock_time. Nhớ rằng Python dùng chỉ số bắt đầu từ 0!