MulaiMulai sekarang secara gratis

Memuat tweet ke dalam DataFrame

Sekarang saatnya mengimpor data ke dalam pandas DataFrame agar kita dapat menganalisis tweet dalam skala besar.

Kita akan bekerja dengan himpunan data tweet yang berisi tagar '#rstats' atau '#python'. Himpunan data ini disimpan sebagai daftar objek JSON tweet di data_science_json.

Kursus ini mencakup banyak konsep yang mungkin sudah Anda lupakan. Jika Anda membutuhkan penyegaran cepat, unduh pandas basics Cheat Sheet dan simpan untuk referensi!

Harap diketahui bahwa ini adalah data asli dari Twitter dan karena itu selalu ada risiko kemunculan kata-kata kasar atau konten ofensif lainnya (dalam latihan ini, dan latihan lain berikutnya yang juga menggunakan data Twitter asli).

Latihan ini adalah bagian dari kursus

Menganalisis Data Media Sosial dengan Python

Lihat Kursus

Petunjuk latihan

  • Impor pandas (ingat, secara konvensi akan kita aliaskan sebagai pd).
  • Ratakan tweet data_science_json dengan flatten_tweets() dan simpan sebagai tweets.
  • Buat DataFrame dari tweets menggunakan pd.DataFrame().
  • Cetak teks dari 5 tweet pertama.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import pandas
import ____ as ____

# Flatten the tweets and store in `tweets`
tweets = ____(____)

# Create a DataFrame from `tweets`
ds_tweets = ____(____)

# Print out the first 5 tweets from this dataset
print(ds_tweets[____].values[0:5])
Edit dan Jalankan Kode