Biraz Twitter metin analizi
Artık tweet'lerden oluşan DataFrame'ini hazırladığına göre, içinde 'clinton', 'trump', 'sanders' ve 'cruz' kelimeleri geçen kaç tweet olduğunu saymak için biraz metin analizi yapacaksın. Egzersiz öncesi kodda, birinci argüman (bir kelime) ikinci argüman (bir tweet) içinde geçiyor mu söyleyen word_in_text() fonksiyonunu tanımladık.
import re
def word_in_text(word, text):
word = word.lower()
text = text.lower()
match = re.search(word, text)
if match:
return True
return False
DataFrame'in satırlarında dolaşıp anahtar kelimelerimizin her birini içeren kaç tweet olduğunu hesaplayacaksın! Her bir aday için nesnelerin listesi 0'a ayarlanmış durumda.
Bu egzersiz
Python'da Orta Düzey Veri İçe Aktarma
kursunun bir parçasıdırEgzersiz talimatları
for index, row in df.iterrows():fordöngüsünde, kod şu anda 'Clinton' geçen her tweet'te (text satırı)clintondeğerini1artırıyor; aynı işlemintrump,sandersvecruziçin de gerçekleşmesi için kodu tamamla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Initialize list to store tweet counts
[clinton, trump, sanders, cruz] = [0, 0, 0, 0]
# Iterate through df, counting the number of tweets in which
# each candidate is mentioned
for index, row in df.iterrows():
clinton += word_in_text('clinton', row['text'])
trump += word_in_text(____, ____)
sanders += word_in_text(____, ____)
cruz += word_in_text(____, ____)