Memuat tweet ke dalam DataFrame
Sekarang saatnya mengimpor data ke dalam pandas DataFrame agar kita dapat menganalisis tweet dalam skala besar.
Kita akan bekerja dengan himpunan data tweet yang berisi tagar '#rstats' atau '#python'. Himpunan data ini disimpan sebagai daftar objek JSON tweet di data_science_json.
Kursus ini mencakup banyak konsep yang mungkin sudah Anda lupakan. Jika Anda membutuhkan penyegaran cepat, unduh pandas basics Cheat Sheet dan simpan untuk referensi!
Harap diketahui bahwa ini adalah data asli dari Twitter dan karena itu selalu ada risiko kemunculan kata-kata kasar atau konten ofensif lainnya (dalam latihan ini, dan latihan lain berikutnya yang juga menggunakan data Twitter asli).
Latihan ini adalah bagian dari kursus
Menganalisis Data Media Sosial dengan Python
Petunjuk latihan
- Impor
pandas(ingat, secara konvensi akan kita aliaskan sebagaipd). - Ratakan tweet
data_science_jsondenganflatten_tweets()dan simpan sebagaitweets. - Buat DataFrame dari
tweetsmenggunakanpd.DataFrame(). - Cetak teks dari 5 tweet pertama.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import pandas
import ____ as ____
# Flatten the tweets and store in `tweets`
tweets = ____(____)
# Create a DataFrame from `tweets`
ds_tweets = ____(____)
# Print out the first 5 tweets from this dataset
print(ds_tweets[____].values[0:5])