MulaiMulai sekarang secara gratis

Mencari teks di tempat yang keliru

Ingat bahwa teks yang relevan tidak selalu berada hanya pada field utama text dari tweet. Teks juga bisa ada di extended_tweet, retweeted_status, atau quoted_status. Kita perlu memeriksa semua field ini untuk memastikan seluruh teks yang relevan sudah terhitung. Kita akan sering melakukannya, jadi kita akan membuat sebuah fungsi yang menangani hal ini.

Dua baris pertama memeriksa apakah field utama text atau extended_tweet berisi teks tersebut. Anda perlu memeriksa sisanya.

Latihan ini adalah bagian dari kursus

Menganalisis Data Media Sosial dengan Python

Lihat Kursus

Petunjuk latihan

Selesaikan fungsi check_word_in_tweet dengan melakukan hal berikut:

  • Periksa apakah field quoted_status-text berisi kata tersebut.
  • Periksa apakah field quoted_status-extended_tweet-full_text berisi kata tersebut.
  • Periksa apakah field retweeted_status-text berisi kata tersebut.
  • Periksa apakah field retweeted_status-extended_tweet-full_text berisi kata tersebut.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

def check_word_in_tweet(word, data):
    """Checks if a word is in a Twitter dataset's text. 
    Checks text and extended tweet (140+ character tweets) for tweets,
    retweets and quoted tweets.
    Returns a logical pandas Series.
    """
    contains_column = data['text'].str.contains(word, case = False)
    contains_column |= data['extended_tweet-full_text'].str.contains(word, case = False)
    contains_column |= data[____].str.contains(word, case = False)
    contains_column |= data[____].____.____(____, case = False)
    contains_column |= data[____].____.____(____, ____)
    contains_column |= ____[____].____.____(____, ____)
    return contains_column
Edit dan Jalankan Kode