Memuat tweet ke dalam DataFrame
Sekarang saatnya mengimpor data ke dalam pandas DataFrame agar kita dapat menganalisis tweet dalam skala besar.
Kita akan bekerja dengan himpunan data tweet yang berisi tagar '#rstats' atau '#python'. Himpunan data ini disimpan sebagai daftar objek JSON tweet di data_science_json.
Kursus ini mencakup banyak konsep yang mungkin sudah Anda lupakan. Jika Anda membutuhkan penyegaran cepat, unduh pandas basics Cheat Sheet dan simpan untuk referensi!
Harap diketahui bahwa ini adalah data asli dari Twitter dan karena itu selalu ada risiko kemunculan kata-kata kasar atau konten ofensif lainnya (dalam latihan ini, dan latihan lain berikutnya yang juga menggunakan data Twitter asli).
Latihan ini merupakan bagian dari kursus
Menganalisis Data Media Sosial dengan Python
Instruksi latihan
- Impor
pandas(ingat, secara konvensi akan kita aliaskan sebagaipd). - Ratakan tweet
data_science_jsondenganflatten_tweets()dan simpan sebagaitweets. - Buat DataFrame dari
tweetsmenggunakanpd.DataFrame(). - Cetak teks dari 5 tweet pertama.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import pandas
import ____ as ____
# Flatten the tweets and store in `tweets`
tweets = ____(____)
# Create a DataFrame from `tweets`
ds_tweets = ____(____)
# Print out the first 5 tweets from this dataset
print(ds_tweets[____].values[0:5])