Mencari teks di tempat yang keliru
Ingat bahwa teks yang relevan tidak selalu berada hanya pada field utama text dari tweet. Teks juga bisa ada di extended_tweet, retweeted_status, atau quoted_status. Kita perlu memeriksa semua field ini untuk memastikan seluruh teks yang relevan sudah terhitung. Kita akan sering melakukannya, jadi kita akan membuat sebuah fungsi yang menangani hal ini.
Dua baris pertama memeriksa apakah field utama text atau extended_tweet berisi teks tersebut. Anda perlu memeriksa sisanya.
Latihan ini adalah bagian dari kursus
Menganalisis Data Media Sosial dengan Python
Petunjuk latihan
Selesaikan fungsi check_word_in_tweet dengan melakukan hal berikut:
- Periksa apakah field
quoted_status-textberisi kata tersebut. - Periksa apakah field
quoted_status-extended_tweet-full_textberisi kata tersebut. - Periksa apakah field
retweeted_status-textberisi kata tersebut. - Periksa apakah field
retweeted_status-extended_tweet-full_textberisi kata tersebut.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def check_word_in_tweet(word, data):
"""Checks if a word is in a Twitter dataset's text.
Checks text and extended tweet (140+ character tweets) for tweets,
retweets and quoted tweets.
Returns a logical pandas Series.
"""
contains_column = data['text'].str.contains(word, case = False)
contains_column |= data['extended_tweet-full_text'].str.contains(word, case = False)
contains_column |= data[____].str.contains(word, case = False)
contains_column |= data[____].____.____(____, case = False)
contains_column |= data[____].____.____(____, ____)
contains_column |= ____[____].____.____(____, ____)
return contains_column