Fungsi untuk meratakan tweet
Biasanya kita tertarik pada ratusan atau ribuan tweet. Untuk itu, masuk akal untuk mendefinisikan sebuah fungsi guna meratakan berkas JSON yang berisi banyak tweet. Mari kita sebut fungsi ini flatten_tweets(). Kita akan menggunakan fungsi ini beberapa kali dalam kursus ini dan menyesuaikannya sedikit saat menangani jenis data yang berbeda.
json telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Menganalisis Data Media Sosial dengan Python
Petunjuk latihan
- Simpan nama layar pengguna ke dalam
user-screen_name. - Simpan teks tweet yang diperluas ke dalam
extended_tweet-full_text. - Simpan nama layar pengguna retweet ke dalam
retweeted_status-user-screen_name. - Simpan teks retweet ke dalam
retweeted_status-text.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def flatten_tweets(tweets_json):
""" Flattens out tweet dictionaries so relevant JSON
is in a top-level dictionary."""
tweets_list = []
# Iterate through each tweet
for tweet in tweets_json:
tweet_obj = json.loads(tweet)
# Store the user screen name in 'user-screen_name'
tweet_obj[____] = ____
# Check if this is a 140+ character tweet
if 'extended_tweet' in tweet_obj:
# Store the extended tweet text in 'extended_tweet-full_text'
tweet_obj[____] = ____
if 'retweeted_status' in tweet_obj:
# Store the retweet user screen name in 'retweeted_status-user-screen_name'
tweet_obj[____] = ____
# Store the retweet text in 'retweeted_status-text'
tweet_obj[____] = ____
tweets_list.append(tweet_obj)
return tweets_list