List comprehension untuk data bertanda waktu
Sekarang Anda akan memanfaatkan apa yang telah dipelajari di bab ini untuk menyelesaikan masalah sederhana dalam ekstraksi data. Anda juga akan diperkenalkan pada sebuah struktur data, yaitu Series di pandas, dalam latihan ini. Kami tidak akan membahasnya secara mendalam di sini, namun yang perlu Anda ketahui adalah bahwa ini merupakan struktur data yang akan sering Anda gunakan saat menganalisis data dari pandas DataFrame. Anda dapat menganggap kolom DataFrame sebagai array berdimensi tunggal yang disebut Series.
Dalam latihan ini, Anda akan menggunakan list comprehension untuk mengekstrak waktu dari data Twitter yang bertanda waktu. Paket pandas telah diimpor sebagai pd dan file 'tweets.csv' telah diimpor sebagai DataFrame df untuk Anda gunakan.
Latihan ini adalah bagian dari kursus
Kotak Perkakas Python
Petunjuk latihan
- Ekstrak kolom
'created_at'daridfdan tetapkan hasilnya ketweet_time. Fakta menarik: kolom yang diekstrak ditweet_timedi sini adalah struktur data Series! - Buat list comprehension yang mengekstrak waktu dari setiap baris di
tweet_time. Setiap baris adalah string yang merepresentasikan cap waktu, dan Anda akan mengakses karakter ke-12 hingga ke-19 dalam string tersebut untuk mengekstrak waktu. Gunakanentrysebagai variabel iterator dan tetapkan hasilnya ketweet_clock_time. Ingat bahwa Python menggunakan penomoran indeks mulai dari 0!
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Extract the created_at column from df: tweet_time
tweet_time = ____
# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]
# Print the extracted times
print(tweet_clock_time)