MulaiMulai sekarang secara gratis

List comprehension untuk data bertanda waktu

Sekarang Anda akan memanfaatkan apa yang telah dipelajari di bab ini untuk menyelesaikan masalah sederhana dalam ekstraksi data. Anda juga akan diperkenalkan pada sebuah struktur data, yaitu Series di pandas, dalam latihan ini. Kami tidak akan membahasnya secara mendalam di sini, namun yang perlu Anda ketahui adalah bahwa ini merupakan struktur data yang akan sering Anda gunakan saat menganalisis data dari pandas DataFrame. Anda dapat menganggap kolom DataFrame sebagai array berdimensi tunggal yang disebut Series.

Dalam latihan ini, Anda akan menggunakan list comprehension untuk mengekstrak waktu dari data Twitter yang bertanda waktu. Paket pandas telah diimpor sebagai pd dan file 'tweets.csv' telah diimpor sebagai DataFrame df untuk Anda gunakan.

Latihan ini adalah bagian dari kursus

Kotak Perkakas Python

Lihat Kursus

Petunjuk latihan

  • Ekstrak kolom 'created_at' dari df dan tetapkan hasilnya ke tweet_time. Fakta menarik: kolom yang diekstrak di tweet_time di sini adalah struktur data Series!
  • Buat list comprehension yang mengekstrak waktu dari setiap baris di tweet_time. Setiap baris adalah string yang merepresentasikan cap waktu, dan Anda akan mengakses karakter ke-12 hingga ke-19 dalam string tersebut untuk mengekstrak waktu. Gunakan entry sebagai variabel iterator dan tetapkan hasilnya ke tweet_clock_time. Ingat bahwa Python menggunakan penomoran indeks mulai dari 0!

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Extract the created_at column from df: tweet_time
tweet_time = ____

# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]

# Print the extracted times
print(tweet_clock_time)
Edit dan Jalankan Kode